暂无搜索历史
GPT-4o掀起一股全模态(Omni-modal)热潮,去年的热词多模态仿佛已经不够看了。
北大与快手AI有解了,他们提出新框架VideoTetris,就像拼俄罗斯方块一样,轻松组合各种细节~
EPFL(瑞士洛桑联邦理工)团队申请到了访问权限,用于研究“上下文学习足以让大模型跟随指令吗?”。
ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCM...
英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长度的都有。
StarShip CodeGen Agent,姚班带队初创公司OpenCSG出品,以23.67%的成绩获得全球第二名的成绩。
距离小镇首次亮相,已经过去了1年多的时间,现在AI Agent已经可以将多智能体合作落地到应用了吗?
这种方法得到的模型,已经学会了看图玩扑克、算“12点”等任务,表现甚至超越了GPT-4v。
更重要的是,团队研究发现原来Transformer和状态空间模型(SSM)竟然是近亲???
最新致歉推文,由Siddharth Sharma(悉达多)和Aksh Garg(阿克什)发出。
“欧洲AI春晚”主论坛现场,李彦宏最新亮相,作为大会唯一受邀中国企业家,再一次为中国AI“代言”。
2024邵逸夫数学科学奖出炉,颁给了解析数论大牛彼得·萨纳克(Peter Sarnak)。
OpenAI长期霸榜的SuperCLUE(中文大模型测评基准),终于被国产大模型反将一军。
Hugging Face开发者大使刚刚把王冠交给了CogVLM2,来自大模型创业公司智谱AI。
中山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。
国内大模型公司零一万物旗下的Yi-Large千亿参数闭源大模型,跃升总榜第七,也成为榜上国产大模型第一。
抓马的是,此次推出的“视频通话”功能一度被称为电影《Her》现实版,而怒斥OpenAI的刚好是给电影中AI配音的斯嘉丽·约翰逊(寡姐)。
但开发难度并不高,无需拿着海量数据从头训练一个模型,甚至都不一定需要懂编程,大幅降低大模型应用落地门槛。
屡屡登上热搜的ChatExcel、ChatLaw等垂直领域产品,都是出自他的团队。最近,由他们发起的Sora复现计划“OpenSora”,更是引发了广泛关注。
让大神Andrej Karpathy一键三连??(点赞+转发+评论),一个教你从头开始实现Llama3的代码库爆火。
暂未填写公司和职称
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市