自2016年以来,谷歌的在线翻译一直由神经机器翻译(NMT)提供支持,今天,该公司正在推出其神经网络驱动的方法,为谷歌翻译iOS和Android应用程序用户提供更准确、更自然的翻译,以实现59种语言的离线翻译。
谷歌产品经理Julie Cattiau在电话采访中告诉VentureBeat, NMT是由翻译团队和谷歌大脑团队使用TensorFlow制作的。卡蒂奥说,与其他谷歌应用程序不同,95%的谷歌翻译的用户群都在美国以外的国家,如印度、巴西和印度尼西亚。
“所以我们听到很多用户说,拥有高质量的在线服务是很好的,但他们中的很多人要么无法接入互联网,要么宁愿节省他们的数据计划。”所以在过去的一年半里,我们把把我们的NMT模型压缩到人们的设备上作为首要任务。”她说道。
以前的机器学习方法是通过扫描句子的短语来提供翻译,而现在离线翻译使用NMT一次分析整块文本,从而实现听起来更自然、语法更合理、语境更清晰的翻译。
当连接到互联网时,谷歌翻译应用中的对话模式可以提供现场语音翻译。然而,NMT离线翻译今天开始了纯文本翻译;它没有扩展到翻译应用程序的功能,允许你解释你拍摄的菜单或翻译人们的声音。谷歌的第一对耳机Pixel Buds的对话模式,去年秋天就被拿来和《银河系漫游指南》里的巴别鱼做比较。
为了使实时语音翻译能够离线,谷歌将必须使人工智能的其他元素结合起来,使对话模式也可以离线使用,例如语音识别和从文本到语音的单词合成。
她说:“每一个部件都需要安装在设备上,以获得完整的工作体验,这肯定是我们想要推出的产品。”“目前还没有公布具体日期,但文本翻译绝对是实现语音端到端的离线翻译的基石之一。”
不需要更新应用程序就可以离线翻译神经机器。谷歌翻译用户如果之前下载了离线翻译包,将会看到一个横幅,鼓励他们点击那里以获得更好的翻译,而翻译新用户到离线翻译将必须进入应用程序,选择他们想要离线使用的语言。每个语言包将占用大约35-45 MB空间,与以前的离线包大小大致相同,但质量更高。
“我们无法在售价50美元的手机上运行这些非常耗电、需要大量计算能力的机型,所以这次发布的诀窍是,工程师们要压缩这些机型,让它们在非常低端的Android设备上运行。”这就是这次发射的挑战。”
卡蒂奥说,用户应该注意到,在线翻译的质量与以前的离线翻译有所不同,但在线翻译仍将比离线翻译更准确,因为在缩小语言包的尺寸方面做出了让步。
与以前使用的基于短语的机器学习方法一样,NMT利用了文章、书籍、文档和搜索结果等内容的数亿个示例翻译。
谷歌强大的语言能力不仅提升了它的翻译应用程序。这家Alphabet子公司已承诺,到今年年底,谷歌助手将提供30多种语言版本,这一数字远远超过Alexa的四种语言和Siri的20种语言。