前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《跨语言大模型》最新综述

《跨语言大模型》最新综述

作者头像
zenRRan
发布2024-04-19 11:09:28
1200
发布2024-04-19 11:09:28
举报

跨语言大模型(MLLMs)能够利用强大的大型语言模型处理和回应多种语言的查询,在多语言自然语言处理任务中取得了显著的成功。尽管取得了这些突破,但仍然缺乏一份全面的调查总结该领域现有方法和最新发展。因此,在本文中,我们进行了深入的综述,并提供了一个统一的视角,总结了多语言大型语言模型领域的最新进展和新兴趋势。本文的贡献可以总结如下:(1)首次综述:据我们所知,我们首次按照多语言对齐的方式对MLLMs研究领域进行了深入综述;(2)新分类法:我们提供了一个新的统一视角,总结了MLLMs的当前进展;(3)前沿与挑战:我们重点介绍了几个新兴领域并讨论了相应的挑战;(4)丰富资源:我们收集了丰富的开源资源,包括相关论文、数据语料库和排行榜。我们希望我们的工作能够推动MLLMs领域的突破性研究。

https://arxiv.org/pdf/2404.04925.pdf

01

跨语言对齐

本文从预训练对齐、指令微调对齐以及下游任务微调对齐分别进行了详细的归纳和介绍:

在每个对齐中,又分为Parameter-Tuning对齐与Parameter-Frozen对齐,具体示例图如下:

Parameter-Tuning对齐

Parameter-Frozen对齐

02

未来方向

该综述探讨了目前跨语言大语言模型潜在的未来研究方向,主要包括:

1、跨语言大模型中的幻觉问题

2、跨语言大模型中的知识编辑问题

3、跨语言大模型中的安全性问题

4、跨语言大模型中的公平性问题

5、跨语言大模型中的语言扩展问题

6、跨语言大模型中的模态扩展问题

03

网站

在这项工作中,作者们还提供了一个网站来整理跨语言大模型的相关进展,地址为:https://multilingual-llm.net/

相关的GitHub地址如下:https://github.com/LightChen233/Awesome-Multilingual-LLM

本文参与?腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-04-18,如有侵权请联系?cloudcommunity@tencent.com 删除

本文分享自 深度学习自然语言处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com