回到顶部

    获鼎晖、搜狗投资:UTH国际如何翻动翻译业?

  • 2017-09-09 13:06:22  来源:21世纪经济报道 开平有线宽频网  字体:【

(原标题:获鼎晖、搜狗投资:UTH国际如何翻动翻译业?)

获鼎晖、搜狗投资:UTH国际如何翻动翻译业?

  本报记者 申俊涵 北京报道

  导读

  UTH国际为何能够获得鼎晖、搜狗等投资方的青睐?在完成B轮融资后,公司的扩张路径又是怎样?

  让人们实现跨语言的无障碍交流,是人工智能技术最有价值的应用场景之一。

  近两年,谷歌、百度、搜狗、科大讯飞等科技公司,纷纷在机器翻译领域加大研发与投入。2016年9月,Google推出谷歌神经网络机器翻译系统。2016年11月,搜狗首次发布实时语音同传技术,同年12月上线全神经机器翻译服务。

  据了解,要想实现跨语言人工智能,核心要素在于两点:一是NMT(神经网络机器翻译技术),二是海量的高质量语料。许多科技公司在技术方面或许旗鼓相当,但在积累语料的数量和质量方面却存在较大差异。

  成立于2012年的上海佑译信息科技有限公司(简称“UTH国际”),则因行业领先的近百亿垂直领域高质量语料句对的大数据积累,而逐渐进入科技巨头的视野。

  “原来我们聚集语料是为了通过智能记忆功能,帮助翻译行业提高效率、降低成本,现在却发现公司的语料大数据也是科技公司跨语言人工智能的核心基础之一。在未来的人工智能领域,得大数据者得天下。”UTH国际董事长杜金林说。

  目前在业务层面,搜狗、腾讯已经接入UTH国际的多语言大数据中心,同时与阿里巴巴、科大讯飞、新东方等科技巨头探讨深度合作的可能。在资本层面,搜狗在8月15日宣布对UTH国际进行战略投资。此前,UTH国际还曾获得鼎晖投资、杭州老板实业集团的投资。

  UTH国际是如何完成近100亿语料大数据积累的,这些语料在人工智能时代体现出怎样的价值?它如何获得鼎晖、搜狗等投资方的青睐,在完成B轮融资后公司的扩张路径又是怎样?

  人工智能让语料价值陡增

  杜金林曾就职于华为全球化翻译中心部门,主要负责把华为研发的产品进行多语言的本地化设计,具体工作涉及文档写作、翻译、工程、测试等。工作过程中,他对翻译行业对接互联网不足的现状认知深刻,便在2012年离职创办了UTH国际。

  “翻译行业有近千亿的市场规模,但行业一直很传统,大部分工作需要人工来完成。”杜金林介绍说,业内虽然有翻译工具CAT,可以减少从业人员的重复工作量。但CAT工具本身并无大数据支持,基于局域网的内部互联数据量远远不够。每家翻译公司自己积累语料数据,速度和效率也很低。谷歌、百度虽然也推出翻译工具,但翻译效果并不尽如人意。

  “我希望把人工翻译级别的精准语料句对都收集起来,然后通过深度学习匹配,通过平台共享给翻译人员、翻译公司等。同时通过平台的交互作用,让用户每完成一句话的翻译,通过私有云反馈到平台上,这样在提高翻译效率和质量的同时,平台累积的数据量就会越来越大。”他说。

  杜金林认为,当平台数据量积累到一定程度后,终极目标是能够自动实现对文本内容的高质量翻译。当这种高质量的自动化翻译引擎对接语音技术,将对翻译服务行业带来颠覆性影响。

  基于杜金林的设想,UTH国际五年间都在进行语料句对的共享和积累,并逐步获得资本方的认可。2012年成立之初,UTH国际获得百万级天使投资。2014年底,UTH国际获得鼎晖投资的4000万元人民币A轮投资。2016年7月,UTH国际获得杭州老板实业集团有限公司的3000万元人民币A+轮投资。

  目前,UTH国际已经积累近100亿句对,涵盖教育、法律、金融、制造业、生命科学等多个垂直领域的多语言大数据。“开始的语料句对积累,部分来自于团队本身资源,大部分通过共享、交换以及行业内的购买等方式,将散落在全球的碎片化语料累积起来。越到后来,来自平台本身互动产生的语料增量就越多。预计到今年年底,UTH国际的语料规模将达到150亿句对。”杜金林说。

  这些句对的积累,主要应用于翻译行业。但科技公司对跨语言人工智能的重视,让UTH国际体现出更大的价值。今年8月,UTH国际完成4200万元人民币B轮融资,搜狗为战略领投方。

  “通过本轮战略投资和资源整合,搜狗搜索将接入UTH国际的多语言大数据中心,扩充搜狗深度神经网络翻译技术的数据来源,以此有效提升及优化搜狗机器翻译效果,推动搜狗在人工智能语言理解方面的产品研发和全球化布局。”杜金林说。

  对UTH国际来说,搜狗在专业技术和广告流量方面都为公司带来很大的价值。杜金林透露,搜狗是公司的第一家战略合作伙伴,公司根据业务需要,将与其他科技巨头展开业务层面的合作。

  融资后谋行业资源整合

  目前,UTH国际的客户主要来自三方面,一是基于人工智能的科技巨头如腾讯、阿里巴巴、讯飞等,是基于公司大数据平台的客户。二是面向普通商业客户,可以直接使用平台工具把商业文档等进行多语言的翻译。三是翻译公司。此外,兼职译者、国有机构、高校等也是公司的客户。

  此次B轮融资完成后,UTH国际计划推出“UTH 3+”生态战略,一是UTH+人工智能,参股基于人工智能方面的企业,如基于人工智能的自动化写作。二是UTH+语料,并购或者参股基于语料采集端的企业。三是UTH+翻译公司,通过商业模式创新,整合国内优秀翻译服务企业,依托UTH的大数据平台,通过提高效率、降低成本、纵向和横向的整合,打造一批基于垂直领域的翻译领军企业,实现翻译服务行业的战略升级。

  

  目前中国市场有近万家翻译公司,UTH国际计划到2017年年底,通过创新的商业模式,整合5到10家优秀翻译公司,参股4-5家左右的科技公司。到2018年年底,计划实现约20家公司的整合,实现UTH的生态战略布局,为公司带来业绩增量,同时确保UTH的大数据平台处于行业领先的位置。

  “鼎晖投资在UTH整合公司的战略布局过程中,从专业层面,对我们的帮助很大。”杜金林说。此外,鼎晖也为公司在资本层面和股权架构设计方面提供了专业指导,并带来“背书”作用。

  “不论是整合翻译公司还是科技公司,我们最核心的考量是让UTH的大数据始终保持行业领先的位置。”杜金林说。

  据行业权威机构评估,翻译行业有近千亿的市场,任何一家公司不可能垄断所有份额,UTH国际的目标是未来能占到市场的重要份额。此外,公司更大的潜在价值将在人工智能领域逐步体现。(编辑 林坤)

  

  • 分享到:  分享到QQ空间
  • 关键字:

    最新新闻

    最新图片新闻

    今日焦点