腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

DeepHub IMBA

不可错过的AI方向干货分享，赶紧关注吧 internet + machine learning +big data +architecture = IMBA

专栏作者

1386

文章

1504621

阅读量

65

订阅数

OpenAI宣布与Stack Overflow合作开发 OverflowAI，帮助技术人员快速找到问题的解决方案

stack 解决方案开发者 openai overflow

OpenAI 与 Stack Overflow 宣布了一项新的 API 合作伙伴关系，此举将利用 Stack Overflow 作为全球领先的高技术内容知识平台的优势，结合 OpenAI 的流行 LLM 模型，为开发者提供强大支持。通过这次合作，双方希望提高 AI 工具的数据准确性和验证度，帮助技术人员快速找到问题的解决方案，使他们能够集中精力处理优先任务。

2024-05-10

960

10个使用NumPy就可以进行的图像处理步骤

图像处理 numpy block image size

图像处理是一种数学计算。数字图像由称为像素的彩色小点组成。每个像素由红、绿、蓝(RGB)三个独立的颜色组成。每个像素中的主色由每个RGB分量的数值决定。

2024-05-10

1060

Gradformer: 通过图结构归纳偏差提升自注意力机制的图Transformer

论文模型数据效率性能

这是4月刚刚发布在arxiv上的论文，介绍了一种名为“Gradformer”的新型图Transformer，它在自注意力机制中引入了指数衰减掩码。以下是主要创新点：

2024-05-10

560

使用PyTorch实现L1, L2和Elastic Net正则化

模型数据 pytorch torch 函数

在机器学习中，L1正则化、L2正则化和Elastic Net正则化是用来避免过拟合的技术，它们通过在损失函数中添加一个惩罚项来实现。

2024-05-10

650

整合文本和知识图谱嵌入提升RAG的性能

知识图谱编码模型索引性能

我们以前的文章中介绍过将知识图谱与RAG结合的示例，在本篇文章中我们将文本和知识图谱结合，来提升我们RAG的性能

2024-05-10

1250

论文推荐：用多词元预测法提高模型效率与速度

论文模型数据效率性能

这是4月发表的论文《Better & Faster Large Language Models via Multi-token Prediction》，作者们提出了一种创新的多词元预测方法，该方法在提高大型语言模型（LLMs）的样本效率和推理速度方面展示了显著优势。本文将对该论文进行详细的推荐和分析，探讨其理论贡献、实验设计以及对未来研究的启示。

2024-05-10

810

号称能打败MLP的KAN到底行不行？数学核心原理全面解析

数学原理变量函数论文

前几天火爆的Kolmogorov-Arnold Networks是具有开创性，目前整个人工智能社区都只关注一件事LLM。我们很少看到有挑战人工智能基本原理的论文了，但这篇论文给了我们新的方向。

2024-05-10

960

循环编码:时间序列中周期性特征的一种常用编码方式

算法编码对象模型数据

在深度学习或神经网络中，"循环编码"（Cyclical Encoding）是一种编码技术，其特点是能够捕捉输入或特征中的周期性或循环模式。这种编码方法常用于处理具有周期性行为的任务，比如时间序列预测或理解展示周期性特征的序列。

2024-05-10

1200

LSTM时间序列预测中的一个常见错误以及如何修正

数据 lstm range size 测试

当使用LSTM进行时间序列预测时，人们容易陷入一个常见的陷阱。为了解释这个问题，我们需要先回顾一下回归器和预测器是如何工作的。预测算法是这样处理时间序列的:

2024-05-10

610

LLM2Vec介绍和将Llama 3转换为嵌入模型代码示例

模型设计数据性能论文

嵌入模型是大型语言模型检索增强生成(RAG)的关键组成部分。它们对知识库和用户编写的查询进行编码。

2024-05-10

1070

BiTCN：基于卷积网络的多元时间序列预测

模型数据网络变量函数

在时间序列预测领域中，模型的体系结构通常依赖于多层感知器(MLP)或Transformer体系结构。

2024-05-10

2490

贝叶斯推理导论：如何在‘任何试验之前绝对一无所知’的情况下计算概率

性能测试量化数据统计

从左至右依次为托马斯·贝叶斯、皮埃尔-西蒙·拉普拉斯和哈罗德·杰弗里斯——逆概率(即现在所说的客观贝叶斯分析)发展中的关键人物。[24]

2024-04-30

1070

如何准确的估计llm推理和微调的内存消耗

存储模型内存优化 LLM

Command-R+， Mixtral-8x22b和Llama 3 70b都在最近的几周内发布了，这些模型是巨大的。它们都有超过700亿个参数:

2024-04-30

960

通过学习曲线识别过拟合和欠拟合

数据性能变量函数模型

如果一个模型对数据进行了过度训练，以至于它从中学习了噪声，那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子，所以它会错误地分类一个看不见的/新的例子。对于一个过拟合的模型，我们会得到一个完美/接近完美的训练集分数和一个糟糕的测试/验证分数。

2024-04-30

1170

2004年4月计算机视觉论文推荐

论文模型视频数据计算机视觉

本文将整理4月发表的计算机视觉的重要论文，重点介绍了计算机视觉领域的最新研究和进展，包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等各个子领域

2024-04-30

630

常用的时间序列分析方法总结和代码示例

title 变量函数数据 set

时间序列是最流行的数据类型之一。视频，图像，像素，信号，任何有时间成分的东西都可以转化为时间序列。

2024-04-26

1140

苹果开源高效语言模型系列 OpenELM，分为4个大小270M、450M、1B和3B

模型苹果数据性能开源

苹果公司最新推出系列高效开源的语言模型 OpenELM，包括OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模的版本（分为预训练版和指令微调版共计八个模型）

2024-04-26

940

微软Phi-3，3.8亿参数能与Mixtral 8x7B和GPT-3.5相媲美，量化后还可直接在IPhone中运行

iphone gpt 量化模型数据

Phi-3是一系列先进的语言模型，专注于在保持足够紧凑以便在移动设备上部署的同时，实现高性能。Phi-3系列包括不同大小的模型：

2024-04-26

2060

Barnes-Hut t-SNE:大规模数据的高效降维算法

数据算法效率优化数据可视化

在数据科学和分析中，理解高维数据集中的底层模式是至关重要的。t-SNE已成为高维数据可视化的有力工具。它通过将数据投射到一个较低维度的空间，提供了对数据结构的详细洞察。但是随着数据集的增长，标准的t-SNE算法在计算有些困难，所以发展出了Barnes-Hut t-SNE这个改进算法，它提供了一个有效的近似，允许在不增加计算时间的情况下扩展到更大的数据集。

2024-04-26

1830

5种搭建LLM服务的方法和代码示例

部署服务服务器模型 LLM

在不断发展的大型语言模型（LLMs）领域中，用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中，我们将总结5种搭建开源大语言模型服务的方法，每种都附带详细的操作步骤，以及各自的优缺点。

2024-04-26

1600

点击加载更多

社区活动

RAG七天入门训练营

鹅厂大牛手把手带你上手实战

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态