欢迎访问云译网,为您提供全国翻译公司,打造专业的翻译服务平台!

发布资讯

您所在的位置 > 首页 > 翻译服务信息 > 正文

谷歌的神经网络翻译是如何形成的

更新时间:2019-07-27 07:26:49

今天上午,由中国互联网协会主办的2017中国互联网大会在北京北京举行。在会上,谷歌翻译研发科学家高干发表了演讲《利用机器学习消除语言障碍》,解释了谷歌神经网络翻译背后的技术以及未来研究和发展的方向。全球仅20%的人能看懂英文,谷歌翻译支持100种语言翻译据报道,谷歌翻译已于2006年推出。经过11年的发展,它已支持100多种语言的翻译,覆盖全球99%的互联网用户。根据高勤的说法,谷歌翻译每天提供超过10亿的翻译,每月活跃用户超过10亿,其中95%来自美国以外。目前,谷歌翻译支持移动摄像头识别,用于即时翻译,移动麦克风和扬声器的即时对话翻译,离线翻译等。高勤解释了推出谷歌翻译服务的原因。 “今天,世界上互联网内容占英语的50%。与此同时,只有20%的人口能够理解英语。可以说世界上大多数人都是。互联网上的大部分内容都是绝缘的来自他们。“神经网络翻译初露锋芒,已堪比非专业人工翻译谷歌翻译质量的显着提高是由于神经网络翻译的发展。据报道,谷歌的神经网络翻译是在2015年9月开发的,将在13个月后上线。谷歌的测试显示神经网络机器翻译和非专业人工翻译相当接近,英国和汉英翻译也取得了最大的进步。高琴还揭示了谷歌神经网络发展的过程。高琴说谷歌的神经网络是预期的研发开始需要三年才能完成,但实际发布时间超出了我们的预期。据了解,9月2日015,谷歌翻译项目开始基于TensorFlow开发。 2016年2月,获得了第一个产品规模模型。 2016年11月,共推出了16种语言。从那时起,神经网络机器翻译已初具规模。目前,超过50%的Google翻译使用神经网络翻译。这是由于谷歌全面布局机器学习硬件和软件,尤其是谷歌张量处理器(TPU)的诞生。高勤认为,神经网络是传统技术的革命性变革。
基于短语的统计机器翻译是一种拼图过程。通过安排和组合短语对,我们试图找到更好的翻译选项。整个决策过程是离散的,支持这种决策的信息也是本地的。相反,神经网络机器学习可以在翻译过程的每一步中利用云语言和目标语言的所有信息,使整个决策过程既连续又全局。探索多语言模型:疑似发现多语言的通用语!然而,从实验室研究到服务10亿人的产品还有很长的路要走。目前,由于语言不同,谷歌翻译仍然需要培训和维护200个模型,这仍然是一项非常繁重的任务。因此,谷歌翻译现在已将注意力转向多语言模式。所谓的多语言模型是指使用同一组神经网络来学习多种语言的翻译。例如,英语,西班牙语和韩语可以在同一翻译模型中翻译。高勤说,多语言模型的机器翻译方法可以很简单。只有告诉神经网络我们想要通过特殊符号翻译的目标语言代码,神经网络才能处理多语言翻译。例如,要翻译成日语,只需要在原始语言之前添加2ja +简单符号。在许多情况下,以这种方式处理的多语言简单符号的性能超过单语言符号的性能。高勤还指出,多语言模式可以很好地处理零数据翻译,两种非英语语言的翻译可以在没有英语传输的情况下实现,这为将来构建统一翻译模型提供了可能。最近的研究表明,谷歌翻译团队目前将神经网络中不同语言中具有相似含义的多语言模型和句子向量表示投射到多维空间,并找到投射到相邻区域的具有相似含义的句子,这表明多语言的表达在神经网络具有一定的普遍性。 “这是否意味着我们找到了一种可以代表多种语言的通用语言?”高琴说。目前尚不确定。我认为需要进一步的研究。
谷歌翻译下一步:探究新的模型结构,追求性能极限目前,谷歌已经推出了神经网络机器翻译模型,其API接口已经提供给开发人员下载和使用。高勤说,下一步我们将继续改进数字,日期,名称,品牌和不常见的短语翻译。同时,我们将进一步研究新的模型结构和培训方法。高勤说,在过去一年的研究中,我们对神经网络机器翻译的理解还是很肤浅的。我们认为神经网络机器翻译只是第一个显示其优势并且未达到性能极限的翻译。

本文取自网络

热门资讯