当前位置：主页 > 查看内容

揭秘Siri，苹果发布论文阐释语音助手设计想法

发布时间：2021-07-18 00:00| 有位朋友查看

简介：最近，苹果发布了一系列论文来阐释语音助手的重要工作机理，公开揭秘Siri，向业界贡献了自己在设计上的不同想法。在第一篇论文中，苹果就语音助手中的多任务处理问题进行了阐释，它指出在Siri中，唤醒处理通常需要两个步骤：AI首先必须确定输入音频中的语音……

最近，苹果发布了一系列论文来阐释语音助手的重要工作机理，公开揭秘Siri，向业界贡献了自己在设计上的不同想法。

在第一篇论文中，苹果就语音助手中的多任务处理问题进行了阐释，它指出在Siri中，唤醒处理通常需要两个步骤：AI首先必须确定输入音频中的语音内容是否与触发短语的语音内容匹配(语音触发检测)，然后必须确定说话者的语音是否与一个或多个注册用户的语音相匹配(说话者验证)。一般方法是将两项任务分别来处理，苹果则认为可以用一个神经网络模型同时解决两项任务，同时它表示，经过验证，该方法各方面性能可以达到预期。

在该论文中，研究人员给出了模型示例。他们在包含16000小时带注释样本的数据集中训练了基于两种思路下设计的模型，其中5000小时的音频带有语音标签，其余均只有扬声器标签。相比于一般训练模型去获取多个标签的思路，苹果通过将不同任务的训练数据进行级联来训练多个相关任务的模型。结果发现，在性能表现相同的情况下，苹果新提出的模型反而更适合应用，它能够在两个任务之间共享计算，大大节省了设备上的内存空间，同时计算时间或等待时间以及所消耗的电量/电池数量都将降低。

在另一篇论文中，苹果还介绍了多语言演讲场景的演讲者识别系统设计——知识图谱辅助听写系统决策。以声学子模型为例，它可以基于语音信号传输痕迹来进行预测，并且其上下文感知的预测组件考虑了各种交互上下文信号，其中上下文信号包含有关发出命令的条件信息、已安装的命令语言环境、当前选择的命令语言环境以及用户在发出请求之前是否切换命令语言环境的信息。

结果显示，这一设计的优势在于，它们可以在语音信号太短而无法通过声学模型产生可靠预测的情况下提供帮助。

此外，苹果还提出了一项补充研究，缓解错误触发问题，即忽略不适合语音助手(Siri)的语音。基于图结构设计AI模型的思路，研究人员提出了一种图神经网络(GNN)，其中每个节点都与标签相连。结果显示，该模型减少了87%的错误触发。

本文转载自网络，原文链接：https://www.im2maker.com/news/20200204/ulso6navoaemej1k.html
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：苹果手机发布新专利？可解决折叠设备折痕问题 下一篇：没有了

随机推荐

苹果iOS 14降级发布

近期卢卡频繁发布越狱相关重要漏洞和更新越狱工具，由于前段时间苹果发布的新硬...
人工智能、深度学习、机器学习概念和区别

人工智能的浪潮正在席卷全球，人工智能（Artificial Intelligence）、机器学习（...
如何减小安卓应用的体积

【51CTO.com快译】不知您是否注意到：用户不断增长的各种业务需求，促使开发人员...
使用Wireshark对网络通信扑捉，进行三次

在网络的通信的时候，都有听说过三次握手四次挥手。但是对其原理是否清晰?本篇文...
机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。这种转变在很大程度上...
为什么说5G之后再无“运营商”？

我觉得是因为5G已经发展的如火如荼，在不需要运营商在对其进行管理了。完全依靠...
苹果专利透露了Apple VR头显防护系统的MR

熟悉VR头显的用户应该都知道一种所谓的防护系统。这是因为VR头显会用数字内容取...
删掉手机上的鸡肋系统软件用这个办法就

手机隐私安全这事儿，一直是老生常谈了。前不久爆出的金立手机拉活木马事件，一...
把iPhone更新到iOS 13.4 车钥匙可以不用

时隔仅一周时间，苹果又发布了iOS13.4以及iPadOS 13.4首个开发者测试版(上一次版...
青岛市与银河水滴共建AI艺术应用创新实验

日前，在2020中国(青岛)艺术博览会期间，青岛双招双引专场活动举行。在专场活动...

揭秘Siri，苹果发布论文阐释语音助手设计想法

推荐图文

下一代人工智能

如何减少建筑工地的伤亡事故？这 10 大AI手段来了

情感语录大全：最幸福的是我爱你，刚好你也爱我！

印度COVID-19患者的检测结果信息几乎全部被泄漏 -

支付宝城市服务正式升级为市民中心：功能更多

5G专网起飞边缘计算不再“边缘”

随机推荐

苹果iOS 14降级发布

人工智能、深度学习、机器学习概念和区别

如何减小安卓应用的体积

使用Wireshark对网络通信扑捉，进行三次

机器学习如何颠覆金融行业

为什么说5G之后再无“运营商”？

苹果专利透露了Apple VR头显防护系统的MR

删掉手机上的鸡肋系统软件用这个办法就

把iPhone更新到iOS 13.4 车钥匙可以不用

青岛市与银河水滴共建AI艺术应用创新实验

关于我们