这次重磅升级,不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。
尽管自然语言处理(Natural Language Processing ,NLP)技术在文本分类、情感分析、机器翻译等任务上取得了显著进展,但文本对抗样本的出...
这是4月刚刚发布在arxiv上的论文,介绍了一种名为“Gradformer”的新型图Transformer,它在自注意力机制中引入了指数衰减掩码。以下是主要创新...
这是4月发表的论文《Better & Faster Large Language Models via Multi-token Prediction》,作者们...
前几天火爆的Kolmogorov-Arnold Networks是具有开创性,目前整个人工智能社区都只关注一件事LLM。我们很少看到有挑战人工智能基本原理的论文...
在论文中对encoder-only和decoder-only模型的特点进行了讨论,特别是在解释为什么将decoder-only的大型语言模型(LLM)转换为有效...
荷兰国家银行数据科学家Alex de Vries在一篇论文中估计,到2027年,整个人工智能行业每年将消耗85至134太瓦时(1太瓦时=10亿千瓦时)的电力。这...
http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html
本届会议共收到了 7262 篇提交论文,接收 2260 篇,整体接收率约为 31%,与去年持平(31.8%)。此外 Spotlights 论文比例为 5%,Or...
首先祝大家五一节快乐!《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。由于作者的英文水平和学术能力不高,需要不断提升,...
腾讯 · 性能工程 (已认证)
要使用 ACM 提供的模版格式,但不想直接将 ACM 中的版权内容显示在脚注部分。
该数据集提供了 2000 年至 2019 年期间冰川海拔和质量变化的全面且全球一致的记录。它利用大量卫星图像(主要来自美国国家航空航天局(NASA)的高级星载热...
好久没有给大家梳理文章了,今天分享8篇有关大模型(LLMs)的最新研究进展,其中涉及涉及大模型推理、应用、方法论、多模态、剪枝等热门研究方向。全部论文获取方式,...
作为会议的AC,Peter Richtarik表示他总共处理了19篇论文,接受论文的平均分为4.25-6.33,被拒论文的平均分为2.60-6.00。
“他山之石,可以攻玉”,站在巨人的肩膀才能看得更高,走得更远。在科研的道路上,更需借助东风才能更快前行。为此,我们特别搜集整理了一些实用的代码链接,数据集,软件...
文章作者依次为:马杰(助理教授)、王平辉(教授)、孔德辰(硕士生)、王泽伟(硕士生)、刘均(教授)、裴红斌(助理教授)、赵俊舟(副教授)。
在接下来的部分,我们提出了一种新的“AI for Math”范式,这种范式不包含在Deepmind的论文中,我们旨在使用KAN的无监督学习模式发现结构不变量中的...
表1:在标准Gym-MuJoCo基准测试上的标准化得分。Trifle的结果是基于12个随机种子的平均值,并报告了均值以及标准差。基线的结果来自于它们各自的论文。...
该论文提出了一种扩展Transformer模型的方法,用于解决传统Transformer模型在长距离依赖建模上的局限性。传统Transformer模型在处理长句...