首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

不靠谱翻译大赛笑话频出,机器翻译依然任重而道远

在进行论文写作,资料学习及新语言学习的过程中,机器翻译软件已经成为不可或缺的一部分。然而,机器翻译软件质量良莠不齐,翻译效果在大多数情况下并不尽如人意,甚至频频闹出笑话,成为众多网红短视频调侃的对象,甚至某短视频平台还进行了“不靠谱翻译大赛”短视频活动,每每令人捧腹。为何到了21世纪,机器翻译仍然不靠谱?下面就从技术原理方面进行解析。

(图源网络)

机器翻译于上世纪80年代开始将基于规则的机器翻译走向实际应用,这也是第一代机器翻译技术。它拥有3种技术路线,第一种是直接翻译,将源语言与目标语言从字面意义上对每个分词、短语进行翻译,再进行拼接,但效果并不理想。第二种则是根据语言学的相关规则,对源语言的句子进行语法分析,结合目标语言的语法规则进行翻译,但每一种语言的语法规则都比较复杂,并且存在相当多的特例情况,这种技术路线也不太合适。另外一种技术路线,则是借助人的大脑翻译来实现机器翻译,但这会涉及到中间语言转化,对翻译精确性有一定影响。

(图源网络)

针对第一代机器翻译技术的不足,产生了第二代翻译技术,即基于统计的机器翻译。它通过对源语言进行段誉切分,再翻译每一个源短语,随后按照统计结果,结合相应的语法规则等按照一定的顺序将翻译后的短语组合成句子。但这种翻译方式,在翻译时往往会由于模型假设较多,上下文建模能力不足,导致调序困难,导致翻译出的句子比较生硬,但相比第一代翻译技术已经有了长足进步。

而第三代基于端到端的神经机器翻译,它不仅包含编码和解码两部分,还额外引入了注意力机制以帮助调序,在翻译时,它首先会通过分词得到输入源语言词序列,并通过“词向量”来表示,再通过RNN神经网络得到正向码表示,随后,通过反向的RNN得到反向码表示,然后结合注意力机制来预测编码的拼接顺序,经过一定的算法,可以得到目标语言的译文。

(图源网络)

然而,截止到今天,即便是第三代神经机器翻译依然无法解决不同语言之间的大段落文档翻译问题,尤其对于句型复杂、表意丰富的中文,仍然需要借助辅助笔译(人工)最终完成翻译过程,机器翻译之路仍然任重而道远。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200331A0I17C00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com