数字化观察网 - 信息化观察网 - 引领行业改革
菜单导航

机器翻译与人工翻译之争

作者: 数字化观察网 发布时间: 2020年09月27日 03:43:53

  机器翻译是指利用计算机把一种自然语言翻译成另一种自然语言的技术,是一门结合了语言学和计算机科学等学科的交叉学科。认知智能是人工智能的最高阶段,自然语言理解是认知智能领域的“皇冠”。机器翻译这一自然语言处理领域最具挑战性的研究任务,则是自然语言处理领域“皇冠上的明珠”。近年来,机器翻译发展十分迅猛,但对于机器翻译与人工翻译孰优孰劣、机器翻译能否取代人工翻译,一直存在争议。机器翻译之父韦弗曾提出“翻译即解码”的结构主义观点,但是,数年之后,他自己又推翻了这一论断,表示“机器成不了普希金,机器翻译永远都无法传达出语言本身的优雅与格调”。

  机器翻译发展迅速

  语言能力是区分人类和动物的重要特征之一,是人类有效交流的保证。用机器来进行语言翻译的想法,最早可追溯到古希腊时期。现代意义上的“机器翻译”一词,由古图拉特(Couturat)和洛(Leau)1903年在《通用语言的历史》一书中最早提出。1949年,韦弗发表了具有广泛影响力的名为《翻译》的备忘录,正式提出了机器翻译的思想。直到2006年Hinton提出深度学习技术,才为实现这一目标提供了更好的解决途径。目前的前沿技术是基于人工神经网络的机器学习,其技术核心是一个拥有海量节点(神经元)的深度神经网络,可以自动地从语料库学习翻译知识。一种语言的句子被向量化之后,在网络中层层传递,转化为计算机可以“理解”的表示形式,再经过多层复杂的传导运算,生成另一种语言的译文。

  2015年,蒙特利尔大学引入注意力机制,使得神经机器翻译达到实用阶段。此后,神经机器翻译不断取得进展。2016年,谷歌GNMT发布,该系统可模仿人脑的神经思考模式,翻译出与人工翻译相媲美的译文。同年,微软在Switchboard对话语义识别达到人类水平,讯飞上线NMT系统,神经机器翻译开始被大规模应用。科学杂志Nature梳理了2016年科技领域的十大突破,排在首位的就是人工智能,其中提及人工智能的机器翻译使错误减少了约60%。随后,Facebook的人工智能研究团队开发了一种新的神经机器翻译算法,在三种机器翻译任务上得分高于所有同类系统。2017 年,微软在斯坦福问答数据集 SQuAD 上达到人类水平。机器翻译的发展速度远远超出人们的想象,但是对于机器翻译是否能够真正完全代替人工翻译,学界仍旧争论不休。

  机器翻译取代人工翻译

  目前而言,一部分专家认为机器翻译很快会达到人工翻译水平,在不远的将来会完全取代人工翻译。2010年,谷歌机器翻译专家欧赫认为文本机器翻译是合理有效的,真正的挑战只在语音识别方面。他提出,未来几年即有可能实现手机端语音到语音的自动翻译。2019年2月《卫报》刊登《机器翻译的时代是否已经到来》一文,美国韦弗利实验室(Waverly Labs)的安德鲁·奥乔亚表示“在未来十到十二年内,机器翻译技术可与人工翻译相媲美,甚至超过人工翻译的水平”。

  专家们对于机器翻译的信心来自最新一代的翻译技术——神经网络翻译。神经网络翻译打造的机器翻译系统,采用了一系列新的学习手段来模拟人工翻译。首先,利用人工智能任务的天然对称性进行对偶学习。当训练集中的一个中文句子被翻译成英文后,系统会将相应的英文结果再翻译回中文,并与原始的中文句子进行比对,进而从这个比对结果中学习有用的反馈信息,对机器翻译模型进行修正。其次,利用推敲网络,模拟人们写作时不断推敲、修改的过程。这样,通过多轮翻译,不断地检查、完善翻译的结果,使翻译的质量得到大幅提升。再次,采用联合训练的方法迭代改进翻译系统。用中英翻译的句子对去补充反向翻译系统的训练数据集,同样的过程也可以反向进行。最后,采用一致性规范让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。这一系列技术有效模仿了人工翻译的过程,极大提升了机器翻译的整体质量。

  除此之外,机器翻译相关学科之间的互动更加频繁,合作更加紧密。翻译界和技术界都呈现出了更大的包容性,相关人士达成一定共识,即过去那种把语言学家排除在外,仅依赖技术界,埋头做数据、分析开发系统的做法是不可取的。在语言学和翻译学领域,越来越多的人开始关注机器翻译,对技术应用探索也不再一味抵触,开始从用户和市场需求的角度来客观看待不同层级和不同受众的语言服务,计算机辅助翻译在专业翻译领域发挥着越来越重要的作用。

热门标签