谷歌利用神经网络在59种语言中实现更好的离线翻译

2020-05-08 16:04:41

导读自2016年以来，谷歌的在线翻译一直由神经机器翻译(NMT)提供支持，今天，该公司正在推出其神经网络驱动的方法，为谷歌翻译iOS和Android应用程序用户提供更准确、更自然的翻译，以实现5

自2016年以来，谷歌的在线翻译一直由神经机器翻译(NMT)提供支持，今天，该公司正在推出其神经网络驱动的方法，为谷歌翻译iOS和Android应用程序用户提供更准确、更自然的翻译，以实现59种语言的离线翻译。

谷歌产品经理Julie Cattiau在电话采访中告诉VentureBeat, NMT是由翻译团队和谷歌大脑团队使用TensorFlow制作的。卡蒂奥说，与其他谷歌应用程序不同，95%的谷歌翻译的用户群都在美国以外的国家，如印度、巴西和印度尼西亚。

“所以我们听到很多用户说，拥有高质量的在线服务是很好的，但他们中的很多人要么无法接入互联网，要么宁愿节省他们的数据计划。”所以在过去的一年半里，我们把把我们的NMT模型压缩到人们的设备上作为首要任务。”她说道。

以前的机器学习方法是通过扫描句子的短语来提供翻译，而现在离线翻译使用NMT一次分析整块文本，从而实现听起来更自然、语法更合理、语境更清晰的翻译。

当连接到互联网时，谷歌翻译应用中的对话模式可以提供现场语音翻译。然而，NMT离线翻译今天开始了纯文本翻译;它没有扩展到翻译应用程序的功能，允许你解释你拍摄的菜单或翻译人们的声音。谷歌的第一对耳机Pixel Buds的对话模式，去年秋天就被拿来和《银河系漫游指南》里的巴别鱼做比较。

为了使实时语音翻译能够离线，谷歌将必须使人工智能的其他元素结合起来，使对话模式也可以离线使用，例如语音识别和从文本到语音的单词合成。

她说:“每一个部件都需要安装在设备上，以获得完整的工作体验，这肯定是我们想要推出的产品。”“目前还没有公布具体日期，但文本翻译绝对是实现语音端到端的离线翻译的基石之一。”

不需要更新应用程序就可以离线翻译神经机器。谷歌翻译用户如果之前下载了离线翻译包，将会看到一个横幅，鼓励他们点击那里以获得更好的翻译，而翻译新用户到离线翻译将必须进入应用程序，选择他们想要离线使用的语言。每个语言包将占用大约35-45 MB空间，与以前的离线包大小大致相同，但质量更高。

“我们无法在售价50美元的手机上运行这些非常耗电、需要大量计算能力的机型，所以这次发布的诀窍是，工程师们要压缩这些机型，让它们在非常低端的Android设备上运行。”这就是这次发射的挑战。”

卡蒂奥说，用户应该注意到，在线翻译的质量与以前的离线翻译有所不同，但在线翻译仍将比离线翻译更准确，因为在缩小语言包的尺寸方面做出了让步。

与以前使用的基于短语的机器学习方法一样，NMT利用了文章、书籍、文档和搜索结果等内容的数亿个示例翻译。

谷歌强大的语言能力不仅提升了它的翻译应用程序。这家Alphabet子公司已承诺，到今年年底，谷歌助手将提供30多种语言版本，这一数字远远超过Alexa的四种语言和Siri的20种语言。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢

标签：谷歌

购团邦网