技术驱动产品 解密百度翻译缘何“后来居上”
发布时间:2011-07-14 08:20:06 来源:ACME 转载 字体: 大 中 小
与传统行业相比,互联网行业新产品在竞争中的“先发优势”并不明显,尤其是用户黏性不大的产品,但也时有发生“后发先至”的案例。近日,百度翻译正式上线,立即受到了行业和用户的普遍关注,对其翻译质量和特色的好评如潮。
作为一个新秀,百度翻译受到广泛欢迎和认可的原因更多在于它“技术驱动产品”的价值诉求。这款由百度公司完全自主投入、研发的在线翻译产品,凭借百度强大的平台优势,充分发挥其国际一流机器翻译研发团队的技术实力,为用户带来更好的中英文翻译体验。
国际影响力的翻译研发团队
技术实力源于顶尖人才的核心竞争力。百度于2010年初开始组建机器翻译团队,经过一年多的时间,组建起一支世界一流的机器翻译研发团队,其技术带头人王海峰博士和吴华博士都是机器翻译领域的世界级专家,有丰富的机器翻译产品研发经验,也曾在国际机器翻译评测中以绝对优势获得第一,并发表过数十篇高水平学术论文。王海峰更是自然语言处理领域世界上影响力最大、也最具活力的国际学术组织ACL(Association for Computational Linguistics)50年历史上唯一当选副主席的华人。除了具有国际影响力的技术带头人之外,现有机器翻译团队核心研发力量均具有6-15年的机器翻译和多语言研发经验,掌握了多语言挖掘和机器翻译核心技术,在学术界和产业界有广泛的影响力。
强大的研发团队以及百度优越的研发条件,促成了百度翻译产品在仅仅一年多的时间里,即以令业界惊叹的速度上线发布,并迅速获得了用户的青睐。
四大核心技术奠定产品优势
与业界同类产品相比,百度翻译具有四大技术亮点:卓越的机器翻译核心技术、领先的语料挖掘和过滤技术、强大的海量计算技术、可靠的web前端技术。
在机器翻译核心技术方面,百度在混合机器翻译技术方面取得重要突破,其以统计翻译为主、实例和规则翻译为辅的方法,充分利用多种翻译方法和各种数据资源的优势,从而保证了了译文的高质量。而通过语料挖掘技术及过滤技术,可实现对机器翻译资源的快速实时挖掘,并从高噪声的海量资源中过滤低质量数据。如翻译“有木有、我勒个去、神马都是浮云”等网络流行语,百度都能准确翻译。而网络上常见的错误翻译 “how old are you (错译:怎么老是你)”,“好好学习、天天向上(错译:good good study, day day up)”,百度翻译都能够成功阻截和过滤。
如果说混合翻译技术、语料挖掘技术及过滤技术主要体现的是产品本身的技术研发优势,那么百度翻译强大的海量计算技术、可靠的web前端技术等利用了百度整体的平台优势。百度翻译借助百度领先的Spider(爬虫)技术抓取海量资源,并在百度的海量处理平台上对这些资源进行有效处理和建模,最后通过运行在百度海量计算平台上的高效解码器完成面向互联网海量翻译需求的高质量翻译。不仅如此,百度已经具备了良好的产品开发协同能力,研发、测试、产品等多部门多团队的协同作战,有效的缩短了产品的开发周期,这也是为什么百度翻译能够在短短一年多时间里问世的原因之一。
翻译质量更胜一筹
在领先技术的引领及强大平台的双重驱动下,百度翻译具备了天生的优势,翻译质量更胜一筹。
从评测结果来看,百度翻译在应对日常用语和网络语言方面优势明显,尤其在翻译结果忠实反映原文语义及符合目标语言习惯这两项指标上表现出色。如在百度翻译输入“你们有什么要问的吗?”,百度翻译结果为达意贴切的“Do you have any questions?”;而在其他较为热门的在线翻译工具中输入该词,则分别出现了“What you have to ask it?”、“What do you have to ask?”等含偏差理解和语法错误的翻译结果,影响了用户的使用体验。
业内人士表示,任何互联网产品的竞争都不再仅仅局限于功能层面,而是包括功能、资源、技术、用户、流量乃至品牌等在内的全方位竞争,基于此,百度翻译凭借着百度的整体实力,无疑会在竞争中更加占据优势。当然,最终获益的还是广大的互联网用户。