荆楚网首页 新闻 政务 评论 问政 舆情 社区 专题 视频 商业 健康 教育 汽车 房产 旅游 金融 手机报 手机荆楚网
微信
新闻频道 > 城市生活

阿里巴巴达摩院资深算法专家陈博兴:有生之年,不必担心机器翻译会全面取代人工翻译

发布时间:2018-12-13 17:48:22来源:荆楚网

  人工翻译会不会被机器翻译所取代?机器翻译带来了哪些实实在在的效益?这些问题一直在众多人心中萦绕不去,业界对此也存有争议。

  2018年12月11日,“1211首届传神者大会”在武汉召开,来自不同领域的千余名行业翘楚齐聚江城,共同探索语言文化传播领域如何跨界融合发展,构建行业全新生态。

  会议间歇,记者专访了阿里巴巴达摩院资深算法专家陈博兴。他从事机器翻译研究近20年,是业界公认的世界一流研究机器翻译、自然语言处理和机器学习的技术专家。

  那么,陈博兴对上述问题有着怎样看法呢?

  机器翻译已炉火纯青?

  提问:机器翻译距今已有近70年历史,您如何诠释机器翻译,它的演进过程是怎样的?

  陈博兴:众所周知,翻译是在准确(信)、通顺(达)的基础上,将一种语言信息转换另一种语言信息的行为。

  机器翻译是利用计算机并结合最新技术,将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。机器翻译距今有近70年的历史了,从1949年开始有备忘录,1951年开始有机器翻译的研究,1954年出现第一台机器翻译系统,上世纪70年代出现了基于规则的机器翻译,其中最成功的规则机器翻译系统是加拿大的一个机器翻译系统,用于翻译天气预报,被成功运用了20多年。

  上个世纪80年代,基于数据的机器翻译系统开始出现。1984年提出了基于实例的机器翻译模型,80年代末出现了基于统计的机器翻译系统,一直到2014年出现神经网络机器翻译系统。

  提问:您对目前机器翻译的质量满意吗?

  陈博兴:机器翻译的质量还不够完美,但是某些语种之间的翻译效果已经很好,比如英法、英西等源语言和目标语言比较接近的语言对之间的翻译。另外在某些场景下结果还是不错的,比如对于新闻这种训练数据比较多,文本比较规范的场景,机器翻译的结果对于理解源语言基本上没有问题。

  提问:您如何看待机器翻译与人工翻译的优劣?

  陈博兴:机器翻译和人工翻译有各自的优缺点,比如说人工翻译有质量的保证,但是缺点也是很明显的,比如说很少有免费的,运转周期很长,而且除非是大的翻译公司,很少有一个译员能够翻译多种语言。

  机器翻译的优点是免费的机器范翻译工具多,可以快速的完成翻译,而且往往一个翻译工具可以提供多种语言的翻译,并且翻译质量一直在提高。缺点也很明显,不同语言翻译质量不一样,因为这个机器是用数据训练的,数据有多有少,翻译的质量也就参差不齐。

  阿里有百亿美元大单来自机器翻译

  提问:从2014年提出来神经网络的机器翻译以来,机器翻译取得了突飞猛进的发展。现实社会中,我们可以看到机器翻译应用到哪些场景呢?

  陈博兴:现实生活中,我们能看到很多机器翻译的应用场景,比如网络内容提供商,像新闻网站、视频网站的翻译有很多是机器翻译提供的。还有像社交网络Facebook、Twitter和微博,除此之外还有情报安全部门,因为情报安全部门要搜集很多跨语言的信息,完全靠人工翻译量很大,所以他们可能先用机器翻译一部分,然后识别里面的安全信息。

  此外,还有全球化公司,一个公司在很多国家都有业务往来,有的公司甚至在100多个国家都有雇员和业务,他们的内部工作文档和沟通需要翻译,这个时候就用机器翻译协助海量的翻译工作。还有跨境服务公司,比如说像阿里巴巴一样,它提供的平台将中国的商品卖到了全球各地,要为这些国家的买家提供商品的翻译,这时候也可以用机器来翻译。

  提问:在具体的运用领域中,机器翻译带来了哪些实实在在的效益?

  陈博兴:虽然机器翻译技术还不够完美,但是在跨境语言的信息交流方面为广大的用户提供了便利,在某些场景下,比如跨境电商,机器翻译还带来了实实在在的收入。每年机器翻译支持的阿里巴巴的电商业务有好几百亿美元,不是说机器翻译给阿里创造了几百亿美元的价值,而是如果没有机器翻译成为交易链路中的一环,这几百亿美元就无法达成交易。

  优质的翻译,机器无法取代

  提问:您是世界一流研究机器翻译的专家。从您的认识看,机器翻译会取代人工翻译吗?

  陈博兴:如果我们只想理解一下翻译后大概的内容,这种情况下人工翻译会大量的被机器取代。但是对于优质的翻译,在可以预见的未来我认为机器翻译不会取代人工翻译,为什么?因为目标就不一样。

  首先对信、达、雅都要求的情况下,人工翻译更有优势,而在量大、有一定错误容忍度的场景下机器翻译更有优势。并且机器翻译质量在可以预见的将来,还达不到高水平专业译员的水平。另外,机器翻译的算法是平行数据,也就是根据译文数据进行的拟合,而平行数据是人工翻译提供的,如果没有人工翻译生产,机器翻译也无从训练一个很好的系统。

  其实机器翻译和人工翻译不是彼此会互相取代的关系,它们之间可以进行很多相互的合作。机器翻译和人工翻译的合作,第一个预想是如人工编辑,先用机器翻译一遍,然后进行人工后编辑。除此之外,在我们看来还有其他的合作模式,比如在人工翻译的流程中加入译文质量的自动评估,提高人工翻译质检的效率,等等。

  在中国的国际化和世界的全球化的进程当中,人工翻译和机器翻译的需求将会同时增加。在没有实现强人工智能的情况下,不要担心机器翻译会全面取代人工翻译。在我们的有生之年都无需担心强人工智能的实现,但是大量的低级重复劳动会被AI(人工智能)和机器人取代,初级的翻译也一样。

(作者:  编辑:李燕