当前位置：主页 > 查看内容

达摩院公布语音AI新进展：移动端也能实现逼近真人的语音交互体验

发布时间：2021-08-11 00:00| 有位朋友查看

简介：9月18日，在2020云栖大会上，达摩院公布了语音AI技术的最新突破：端上语音识别和语音合成能力首次达到媲美云端的水平，这意味着未来个人用户在移动终端即可轻松体验逼近真人的语音技术。据介绍，达摩院最新的语音技术已在淘宝直播、钉钉会议、高德导航等场景……

9月18日，在2020云栖大会上，达摩院公布了语音AI技术的最新突破：端上语音识别和语音合成能力首次达到媲美云端的水平，这意味着未来个人用户在移动终端即可轻松体验逼近真人的语音技术。据介绍，达摩院最新的语音技术已在淘宝直播、钉钉会议、高德导航等场景大规模应用，正全面对外开放。

语音AI的核心是让机器听懂人话、并能开口说话，语音合成和语音识别技术是实现这些目标的基础。但由于过去几年业界在语音模型上未能有突破性创新，高精度的语音交互任务长期依赖云端算力，造成了语音指令处理不可避免的延时等问题。

此次达摩院率先在算法模型上实现创新，推出E2E-ASR端到端语音识别技术及全新的端上KAN-TTS语音合成技术，首次在移动终端上实现接近云端的语音识别与合成效果。

据介绍，在语音识别方面，达摩院提出SAN-M网络结构及基于SCAMA的流式端到端语音识别框架，提升计算效率的同时，还将高难度场景中的语音识别错误率降低近三成。达摩院研发的语音识别系统，可纯离线、低成本部署在手机端，原型系统不到40MB，识别效果媲美超过100GB的达摩院上一代DFSMN-CTC云端系统。

继去年发布仿真率可达97%的自研KAN-TTS语音合成模型后，达摩院此次在移动端实现了对语音模型的“大瘦身”，相比云端，端上模型大小压缩了101倍，计算量压缩35倍，通过终端算力即可快速复现逼近真人的语音。例如，高德地图近期发布了利用达摩院全新语音技术合成的李佳琦、林志玲、小团团等明星导航语音包，语音效果较之前更自然，断网状态下语音导航也不会中断。

达摩院语音实验室负责人鄢志杰表示，“在终端处理语音任务一直是学术界和工业界的难题，达摩院最新的语音技术有效释放了终端设备的能力，让终端也能轻松处理语音任务，我们相信，在终端算力和云端算力的协同支撑下，未来语音交互将无处不在。”

过去几年，阿里语音AI取得了一系列突破。2019年，阿里语音AI入选《麻省理工评论》“全球十大突破性技术”，是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示，阿里语音AI以44%的市场份额，在云上语音AI市场中位居第一。

本文转载自网络，原文链接：http://www.51cto.com
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：2020年全球智慧灯杆市场现状与发展前景分析 下一篇：没有了

随机推荐

人工智能那么火~如今AI的应用场景都有哪

人工智能已经逐渐走进我们的生活，并应用于各个领域，AI 既可以是我们的工作伙伴...
5G手机价格持续下探谁在收割中端市场？

【Counterpoint发布的报告指出，2020年全球5G智能手机出货量将超过2.7亿台，5G手...
基尼不纯度：如何用它建立决策树？

本文转载自公众号读芯术(ID：AI_Discovery)。决策树是机器学习中使用的最流行和...
压岁钱太多怎么办？微信提现免手续费你会

心心念的春节假期终于过完了，小伙伴们是不是都赚了个盆满钵满。不过问题也来了...
人工智能驱动内存互连进化

人工智能(AI)、车用芯片的复杂程度逐步递增，边缘处理比重也在增加，存储的选择...
重磅功能！博睿数据APM助企业从容应对云

近日，博睿数据应用性能监控产品Bonree Server全面升级，在自动化、可观测性方面...
人工智能(Artificial Intelligence)入门

要问现在的科技界什么最火？答案八九不离十是人工智能，机器学习，深度学习等等...
基于14台iPhone，苹果全景VR相机专利公布

2月23日青亭网报道，近期USPTO公布苹果一项关于全景相机的专利（专利号202100512...
深圳市携手华为宣布共建鹏城智能体

【中国，上海，2020年9月24日】在HUAWEI CONNECT 2020期间，深圳市与华为携手宣...
5G发展取得显著成效，终端连接数已超过1

9月22日下午，国务院新闻办公室举行国务院政策例行吹风会，介绍《关于以新业态新...

达摩院公布语音AI新进展：移动端也能实现逼近真人的语音交互体验

推荐图文

5G为不同行业带来无限机会

IT领导者在2021年对人工智能和机器学习的期望

机器学习和计算机视觉的20大图像数据集

制造业人工智能8大应用场景

索尼专利曝光新PSVR控制器原型或提供触觉反馈功能

为什么反感人脸识别？

随机推荐

人工智能那么火~如今AI的应用场景都有哪

5G手机价格持续下探谁在收割中端市场？

基尼不纯度：如何用它建立决策树？

压岁钱太多怎么办？微信提现免手续费你会

人工智能驱动内存互连进化

重磅功能！博睿数据APM助企业从容应对云

人工智能(Artificial Intelligence)入门

基于14台iPhone，苹果全景VR相机专利公布

深圳市携手华为宣布共建鹏城智能体

5G发展取得显著成效，终端连接数已超过1

关于我们