以技术为引擎 百度在线翻译精益求精
发布时间:2012-02-03 09:01:19 来源:ACME 转载 字体: 大 中 小
不断提升翻译质量 用效果赢取用户
对于翻译产品来说,翻译的准确性与否是最重要的。百度翻译在卓越的机器翻译技术、领先的语料挖掘和过滤技术、强大的海量计算技术、可靠的web前端技术等四大领先技术的支撑下,取得了“后发先至”的效果。以语料发掘和过滤技术为例,百度翻译全新的互联网双语语料挖掘技术方案,使得1000万句对被有效过滤为更加精准的400万,从而帮助翻译质量得到明显提升。
此前曾有一个试验评测,通过选择一个反应用户需求的测试集,首先人工翻译这个测试集的每个句子,得到多个人工翻译结果,然后机器翻译结果和人工翻译结果比较,得分越高(BLEU值,0至1之间),翻译质量越好。在这方面,百度翻译全面领先竞争对手,尤其在口语翻译方面,优势更为明显。
和试验测评一样,在实例翻译中百度翻译也有着更加精准的翻译效果。尤其是在有明显中国特色的成语、俗语、网络流行语等方面。以“好好学习天天向上、有木有、我勒个去、神马都是浮云”等为例,百度翻译的翻译结果分别是“Study hard and make progress every day、Yes or no、What the hell、Everything is nothing”,翻译内容可靠。
不仅如此,百度翻译还在细节方面不断优化和提升,“投诉功能”让每一个意见和建议都能得到及时回复;“双语对照查看”,更加符合本土用户的阅读习惯;“分享收藏”则顺应了社交时代的发展趋势。
领先的研发团队 兼具国际视野与本土执行
在百度翻译领先的产品质量和翻译效果的背后,是一支兼具国际视野与本土执行的高战斗力研发团队。
据了解,百度翻译研发团队组建于2010年初,从最初的3名正式员工加上一个实习生的“编制”,不断发展壮大成为了由世界级机器翻译专家王海峰博士和吴华博士领衔,同时拥有众多在机器翻译、语料发掘、海量计算、Web前端技术等领域掌握核心技术、有着多年实战经验的“精英团队”。
以王海峰博士为例,作为百度基础技术首席科学家,王海峰博士多年以来一直致力于搜索、自然语言处理、机器翻译、语音技术、机器学习与数据挖掘、推荐及个性化等领域的研发,其研究成果大量应用于众多广泛使用的产品中,也发表过大量一流国际期刊论文及顶级国际会议论文,并申请了中国、美国及日本等多个国家专利20余项。而且王海峰博士还是顶级国际学术组织ACL(The Association for Computational Linguistics)50年历史上唯一当选副主席的华人。
顶级的领军人物和强悍骨干成员,让百度翻译团队不仅具备国际化的视野格局,同时还拥有本地化的执行能力,这些保证了百度翻译在不借助于任何外力和资金的情况下,完全依靠自主研发和自有技术,在短短一年的时间内,就推出了有着优异表现的高质量翻译产品。