观点机器人翻译

“亿级翻译需求”存在吗?

邹剑宇:可预见的时间里,机器翻译一直都会不完美。这并非坏消息,它给人类留了尊严和安全感,保留了翻译职业,甚至为译员提供了更多的商业需求和工作岗位。

2013年底我和搭档魏勇鹏创办公司的时候,他说了两件事:一是,谷歌机器翻译几乎不再聘请语言学专家了,由懂得统计、计算的计算机专家主理开发。二是,谷歌有世界上最丰富的多语言语料数据,但对这种基于数据统计训练而成的翻译引擎来说现状有点尴尬,更多语料能带来效果不再明显了,尽管谷歌的语料、用户量和使用量都在日益增多。

在我们运营公司的两年多时间里,遇到了很多客户和投资人,他们问的第一句话是:“你们机器翻译能达到什么样的准确度?”这个问题意味深长,我一般只能回答说:“在某些垂直领域,我们比谷歌翻译要好。”这句带有挑衅意味的话让听者将信将疑却无从反驳,因为Ta从未得到过无瑕的机器翻译体验——像科幻影视文学、类似《星际迷航》里展现的,那边阿凡达星语说出来,这边火星人听进去,毫无停顿卡带的痕迹。

行内人用专业尺度评价机器翻译的现实是这样:美国商务部下属的国家标准与技术研究所NIST举办的一项机器翻译研究水平评测,采用BLEU(Bilingual Evaluation Understudy)标准。 其原理是比较机译结果和人译结果的相似度,完全一致得分为1(当然不同的人的翻译很难“完全一致”,所以得分1为理想值)。2008年NIST的英文-中文的机器翻译评测结果,谷歌翻译得分0.4142,微软亚洲研究院提交的测评是0.4099,厦门大学得分0.2502;谷歌和微软亚洲的中文-英文机翻得分分别是0.2999和0.2901,中科院自动化所的得分是0.2407。

您已阅读14%(626字),剩余86%(3975字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。
版权声明:本文版权归manbetx20客户端下载 所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。
设置字号×
最小
较小
默认
较大
最大
分享×