首页
学习
活动
专区
工具
TVP
发布

DeepHub IMBA

不可错过的AI方向干货分享,赶紧关注吧 internet + machine learning +big data +architecture = IMBA
专栏作者
1386
文章
1504621
阅读量
65
订阅数
OpenAI宣布与Stack Overflow合作开发 OverflowAI,帮助技术人员快速找到问题的解决方案
OpenAI 与 Stack Overflow 宣布了一项新的 API 合作伙伴关系,此举将利用 Stack Overflow 作为全球领先的高技术内容知识平台的优势,结合 OpenAI 的流行 LLM 模型,为开发者提供强大支持。通过这次合作,双方希望提高 AI 工具的数据准确性和验证度,帮助技术人员快速找到问题的解决方案,使他们能够集中精力处理优先任务。
deephub
2024-05-10
960
10个使用NumPy就可以进行的图像处理步骤
图像处理是一种数学计算。数字图像由称为像素的彩色小点组成。每个像素由红、绿、蓝(RGB)三个独立的颜色组成。每个像素中的主色由每个RGB分量的数值决定。
deephub
2024-05-10
1060
Gradformer: 通过图结构归纳偏差提升自注意力机制的图Transformer
这是4月刚刚发布在arxiv上的论文,介绍了一种名为“Gradformer”的新型图Transformer,它在自注意力机制中引入了指数衰减掩码。以下是主要创新点:
deephub
2024-05-10
560
使用PyTorch实现L1, L2和Elastic Net正则化
在机器学习中,L1正则化、L2正则化和Elastic Net正则化是用来避免过拟合的技术,它们通过在损失函数中添加一个惩罚项来实现。
deephub
2024-05-10
650
整合文本和知识图谱嵌入提升RAG的性能
我们以前的文章中介绍过将知识图谱与RAG结合的示例,在本篇文章中我们将文本和知识图谱结合,来提升我们RAG的性能
deephub
2024-05-10
1250
论文推荐:用多词元预测法提高模型效率与速度
这是4月发表的论文《Better & Faster Large Language Models via Multi-token Prediction》,作者们提出了一种创新的多词元预测方法,该方法在提高大型语言模型(LLMs)的样本效率和推理速度方面展示了显著优势。本文将对该论文进行详细的推荐和分析,探讨其理论贡献、实验设计以及对未来研究的启示。
deephub
2024-05-10
810
号称能打败MLP的KAN到底行不行?数学核心原理全面解析
前几天火爆的Kolmogorov-Arnold Networks是具有开创性,目前整个人工智能社区都只关注一件事LLM。我们很少看到有挑战人工智能基本原理的论文了,但这篇论文给了我们新的方向。
deephub
2024-05-10
960
循环编码:时间序列中周期性特征的一种常用编码方式
在深度学习或神经网络中,"循环编码"(Cyclical Encoding)是一种编码技术,其特点是能够捕捉输入或特征中的周期性或循环模式。这种编码方法常用于处理具有周期性行为的任务,比如时间序列预测或理解展示周期性特征的序列。
deephub
2024-05-10
1200
LSTM时间序列预测中的一个常见错误以及如何修正
当使用LSTM进行时间序列预测时,人们容易陷入一个常见的陷阱。为了解释这个问题,我们需要先回顾一下回归器和预测器是如何工作的。预测算法是这样处理时间序列的:
deephub
2024-05-10
610
LLM2Vec介绍和将Llama 3转换为嵌入模型代码示例
嵌入模型是大型语言模型检索增强生成(RAG)的关键组成部分。它们对知识库和用户编写的查询进行编码。
deephub
2024-05-10
1070
BiTCN:基于卷积网络的多元时间序列预测
在时间序列预测领域中,模型的体系结构通常依赖于多层感知器(MLP)或Transformer体系结构。
deephub
2024-05-10
2490
贝叶斯推理导论:如何在‘任何试验之前绝对一无所知’的情况下计算概率
从左至右依次为托马斯·贝叶斯、皮埃尔-西蒙·拉普拉斯和哈罗德·杰弗里斯——逆概率(即现在所说的客观贝叶斯分析)发展中的关键人物。[24]
deephub
2024-04-30
1070
如何准确的估计llm推理和微调的内存消耗
Command-R+, Mixtral-8x22b和Llama 3 70b都在最近的几周内发布了,这些模型是巨大的。它们都有超过700亿个参数:
deephub
2024-04-30
960
通过学习曲线识别过拟合和欠拟合
如果一个模型对数据进行了过度训练,以至于它从中学习了噪声,那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子,所以它会错误地分类一个看不见的/新的例子。对于一个过拟合的模型,我们会得到一个完美/接近完美的训练集分数和一个糟糕的测试/验证分数。
deephub
2024-04-30
1170
2004年4月计算机视觉论文推荐
本文将整理4月发表的计算机视觉的重要论文,重点介绍了计算机视觉领域的最新研究和进展,包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等各个子领域
deephub
2024-04-30
630
常用的时间序列分析方法总结和代码示例
时间序列是最流行的数据类型之一。视频,图像,像素,信号,任何有时间成分的东西都可以转化为时间序列。
deephub
2024-04-26
1140
苹果开源高效语言模型系列 OpenELM,分为4个大小270M、450M、1B和3B
苹果公司最新推出系列高效开源的语言模型 OpenELM,包括OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模的版本(分为预训练版和指令微调版共计八个模型)
deephub
2024-04-26
940
微软Phi-3,3.8亿参数能与Mixtral 8x7B和GPT-3.5相媲美,量化后还可直接在IPhone中运行
Phi-3是一系列先进的语言模型,专注于在保持足够紧凑以便在移动设备上部署的同时,实现高性能。Phi-3系列包括不同大小的模型:
deephub
2024-04-26
2060
Barnes-Hut t-SNE:大规模数据的高效降维算法
在数据科学和分析中,理解高维数据集中的底层模式是至关重要的。t-SNE已成为高维数据可视化的有力工具。它通过将数据投射到一个较低维度的空间,提供了对数据结构的详细洞察。但是随着数据集的增长,标准的t-SNE算法在计算有些困难,所以发展出了Barnes-Hut t-SNE这个改进算法,它提供了一个有效的近似,允许在不增加计算时间的情况下扩展到更大的数据集。
deephub
2024-04-26
1830
5种搭建LLM服务的方法和代码示例
在不断发展的大型语言模型(LLMs)领域中,用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中,我们将总结5种搭建开源大语言模型服务的方法,每种都附带详细的操作步骤,以及各自的优缺点。
deephub
2024-04-26
1600
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com