暂无搜索历史
5 月 22 日凌晨,微软 Build 2024 开发者大会在美国西雅图召开,今天的发布有关 AI 技术,更有关 AI 带来的新工具。
Anthropic 已经确定了如何在 Claude Sonnet 中表征数百万个概念。这是对现代生产级大型语言模型的首次详细理解。这种可解释性将帮助我们提高人工...
本论文作者王语霖是清华大学自动化系 2019 级直博生,师从吴澄院士和黄高副教授,主要研究方向为高效深度学习、计算机视觉等。他曾以第一作者在 TPAMI、Neu...
「三十年前,我们在这里发布了 Windows 95。三十年后,我们再次宣布 Windows 的进化,现在是令人难以置信的新 AI 时代了,」微软 CEO 萨提亚...
上周,一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena,排名直接超过 GPT-4...
在不久之前的 2024 TED 演讲中,李飞飞详细解读了 空间智能(Spatial Intelligence)概念。她对计算机视觉领域在数年间的快速发展感到欣喜...
今年年初,英伟达 CEO 黄仁勋因为劝人「别再学习计算机」被送上热搜。但其实,他的原话是「过去,几乎每个人都会告诉你,学习计算机至关重要,每个人都应该学会编程。...
一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并在代码生成任务上全面领先。
经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。
对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练,简单来说就是「规模扩展」。
移动应用已经成为我们日常生活的一大重要组成部分。使用移动应用时,我们通常是用眼睛看,用手执行对应操作。如果能将这个感知和交互过程自动化,用户也许能获得更加轻松的...
在 AI 对齐问题上,在线方法似乎总是优于离线方法,但为什么会这样呢?近日,Google DeepMind 一篇论文试图通过基于假设验证的实证研究给出解答。
本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。
今年 2 月,谷歌上线了多模态大模型 Gemini1.5,通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文,更强推理能力,可以更...
本论文作者主要来自于腾讯光子工作室团队,一作何炫华 (hexuanhua@mail.ustc.edu.cn) 是中国科技大学在读的研究生,他的研究方向为图像 /...
5 月 16 日,星纪魅族正式发布全新 Flyme AIOS 系统,一系列全新 AI 功能全方位展现了AI对智能辅助、系统交互能力的提升。紧接着的 5 月 17...
2024 年 5 月 17 日,智源研究院举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外 140 余个开源和商业闭源的语言...
距离 GPT-4o 发布几天后,OpenAI 又上新了。这次,他们瞄准 ChatGPT 的数据分析功能,那些折线图、柱状图、饼图等分析起来毫无压力。
本文作者熊伟是伊利诺伊香槟分校的在读博士生,其导师为 Tong Zhang 与 Nan Jiang。他的主要研究方向是 RLHF 与机器学习理论。邮箱: wx1...
在人工智能科学的先锋领域,尤其是深度学习与决策智能的探索中,文青松博士凭借其在学术研究与实际应用方面的卓越贡献,已然成为业界领军人物。在最近举行的国际深度学习研...
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市