导航菜单

Google Parrotron Al的开发旨在帮助语言障碍患者

谷歌人工智能部门去年决定与NOAA(美国国家海洋和大气管理局)合作,利用人工智能更好地了解在夏威夷水域游泳的座头鲸的歌曲图案。现在,Google团队正在研究一个新项目,以帮助用户解决语言问题。

结合虚拟助手和语音识别服务的重要性,他们分析了如何使用这些动态特性来改善这些用户的沟通和交互。

正如Google在其人工智能博客中的解释中所解释的那样,Parrotron是基于序列,基于注意力的模型,该模型使用两个平行的输入/输出对集合在两个阶段进行训练。

迄今为止,由于没有对AI进行过针对不同场景的训练,因此语音障碍人士已被排除在这些技术之外。为了解决这个问题,Google开发了Parrotron:

Parrotron是一种端到端训练有素的语音到语音转换模型,可将输入频谱图直接映射到另一个频谱图,而无需使用离散的中间表示。可以训练该模型以使任何说话者的语音正常化,而不管重音,韵律或背景噪音如何。基本上,这是一个端到端的人工智能网络,可以将非典型语音模式转换为语音障碍者的合成语音。

Google团队针对不同的用户测试了该技术,Parrotron系统将字错误率从89%降低到32%。一个令人鼓舞的结果表明了该工具的潜力。

我们可以在Google的报告中阅读这些测试的所有步骤以及培训的技术细节。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。