新译网

新译深度神经网络机器翻译系统上线,智能与效率再度刷新

2017-01-24 17:41:54

newtranx

2017年1月20日,新译科技正式对外公布平台新升级的机器翻译系统。

新译科技的机器翻译(NewTranx MT)在基于自有的深度学习技术,对当前线上基于层次短语模型的英中和中英翻译方向进行再升级,本次升级后的模型(http://mt.newtranx.com/)克服了传统方法“先分割原句子为多个片段后再翻译”的缺陷,能够充分利用上下文信息,对句子进行整体的编码和解码,从而产出的译文更佳流畅。

机器翻译算法的历史与衍变

自上世纪40年代起,基于规则、实例以及统计的机器翻译方法渐次登场,各种方法的结合也是层出不穷。自2006年以来,神经网络机器翻译(Neural Machine Translation, NMT)技术异军突起,取得了翻译质量的大幅提升。

传统的规则方法, 需要具有语言学背景的人编写两种语言之间的转换规则,然后再将这些规则录入到计算机。

统计机器翻译, 目标同样是实现自动的将一种语言转换为另外一种语言,但是其中的转换规则是机器从大规模的平行语料库中自动学习得到的而非语言学家人为提供,这就克服了传统规则方法面临的知识获取瓶颈的问题。统计的方法虽然取得了不错的效果,但是整个翻译过程中,需要依次调用其他各种更底层的自然语言处理(Natural Language Processing, NLP)算法,比如分词、词性标注、句法分析等,最终才能生成正确的翻译。这样像流水线一样的翻译方法,一环套一环,中间任意一个环节有了错误,这样的错误会一直传播下去(error propagation),导致最终的结果出错。

利用深度神经网络的方法可以改进统计方法的缺点。现今而言,利用深度学习的机器翻译有两种:

1.仍然是以统计机器翻译为框架,利用深度学习来改进统计机器翻译的各个模块,比如语言模型、翻译模型、解码器、调序模型。

2.就不在以统计的方法为框架,而使用端到端的翻译(End-to-End Learning),即跳过中间各种子 NLP 步骤(无需统计中的词对齐、人为设计的特征值),用深层网络结构去直接学习拟合源语言到目标语言的概率。

神经网络机器翻译分类变迁

新译科技的核心翻译技术

新译科技机器翻译团队技术最初源自澳门大学、葡萄牙里斯本和卡耐基梅隆大学自然语言处理实验室,无论是基于规则的方法,还是基于统计的数据驱动的方式,再到当前最新的深度学习技术,新译科技研发团队时刻紧跟前沿科技,第一时间把新型智能技术成果转化到实际需求的解决方案中。

这家以技术为核心的科技团队始终在解决人工智能的三大关键要素:1)模型 2)大数据 3)计算能力。

据透露,本次新译科技新升级的机器翻译,采用了8000万基础训练数据,并将长短时记忆(Long Short-term Memory)引入到端到端的神经网络机器翻译。长短期记忆通过采用设计门开关的方法解决了训练递归神经网络时的“梯度消失”和“梯度爆炸”问题,能够较好的捕获长距离依赖。在工程师的全力配合下历经三个月的奋战,最终解决了神经网络让人头疼的解码速度过慢问题,现如今,终于带着朦胧的面纱,可以让大家“为难”这个新诞生的新译机器翻译。

http://mt.newtranx.com

另外,新译科技负责人表示,在未来的20天里平台将陆续把法语、德语、俄语、西班牙语、葡萄牙语、日语、韩语共计七类主流语言全部替换为神经网络模型,给更广大的用户群体提供更准确、更流畅的翻译服务。让我们一起期待这一刻的到来。

通过以下网址尝试让它为您解决翻译难题:

http://mt.newtranx.com/

NewTranx MT演讲翻译小案例,回顾历史文章:

《特朗普就职典礼全文演讲快速翻译—新译科技神经网络机器翻译篇》

新译科技成立于2014年,是一家利用人工智
能和大数据技术提供互联网以及移动互联网
服务与应用的科技公司。

联系我们

  北京:010-53812029     深圳:0755-86529976

  support@newtranx.com

  北京市朝阳区望京东园四区7号楼绿地中心B座2005-2006室
     深圳市南山区清华信息港科研楼909室