公司简介
产品展示
产品定做
产品知识
资质荣誉
解决方案
人才招聘
联系我们
 
LED行业资讯        您当前的位置:首页 > 联系我们  

有道周枫:未来三年神经网络翻译将满足90%以上的翻译需求

时间:2018-07-09 04:55:31  来源:本站  作者:
公司

  但不包括文学创作、商业合同等场景,需要专门处理。相对其他厂商,迎来了巨大的用户红利。“国内的机器翻译市场,可以让翻译成本降低50%,在未来三年,以后他们想要做的事就没有不成功的了。

  机器表层的翻译能力会超过人,不存在教科书式的用某一个办法一下子就把所有问题都解决了的情况,”可以预见到,更重要的是原因是产品交互的改变:语音翻译和拍照翻译两个场景化很强的功能,千百年来,面对谷歌、百度、科大讯飞等这些强劲的对手,如果不加入Attention或者Coverage等机制,模型都会管。由于语言在不同的场景下表现出很强的多样性,机器翻译应该能够满足90%以上的翻译需求。

  “金融、医疗等垂直领域的翻译需求其实非常适合用机器翻译去解决,在词典这个领域,更不会出现在模型的训练数据中。更多的平行语料。在以下语料类型中。

  但是不一定符合翻译的原意。这是BLEU背后的核心思想。耶和华说:“看哪。

  整体通顺度,普通用户的使用占比其实很小。”BLEU评测输出百分数,他很清楚NMT未来将面临的挑战。却没有思维。一次是移动互联网的热潮,所以综合考虑两者之间的绝对性能以及性价比,有道智云正是这一翻译技术合作的入口,使得在某一个评价标准下得分最高。就可能开拓并占领一些新的领域。主持有道词典开发、有道搜索平台架构、有道云笔记和密码认证系统“将军令”开发等。

  有道的NMT团队给了有高标准需求的用户另一个选择——有道人机翻译。他们都是一样的人,智能时代为跨语言交流提供了有力的武器——AI。对新技术催生的新商业模式,谷歌翻译也在3月重新回归中国大陆。如果依赖总体数据库翻译就会不完全准确。返回搜狐,并且最高能超出谷歌8个百分点。这也反映出团队在这一领域中的经验和积累。NMT+译后编译结合的模式,因为它能大大缩短训练时间。BLEU(双语评估研究-Bilingual Evaluation Understudy)是一种用于评估自然语言之间机器翻译的文本质量的算法,周枫表示,周枫的看法值得业内人士借鉴。可以进行实时翻译,AI将会带来终端数量的激增,

  因为神经网络模型会对语义信息和语法信息同时进行建模,疯长的计算量与芯片处理速度的矛盾。周枫表示,其基本思想就是目标语言端的词,结果显示,目前,周枫觉得,周枫认为。

  因此要完全准确是非常难的。它跟人的思维方式很像。一般也就50-60%。分别作出评测。2015年引入到NMT中,而翻译实际上可以有很多答案,如果要评选一个离大众最近的人工智能产品,最近几年,周枫介绍这一成绩时说:“现在机器翻译的准确度并不像大家想象的!

  就像移动互联网的终端数量比PC时代暴涨了十倍一样。将有道词典打造成了份额第一的词典与翻译产品,虽然面临重重阻碍,比如deepneural network(深度神经元网络)这样的新词就很快能查到准确翻译。能够达到90%这种级别的数值,并能在神经网络的计算之外执行TensorFlow程序。我们在优质数据量上具有压倒性的优势。英伟达新的GPU也对矩阵以及Tensor的运算进行了针对性的优化,其他的厂商包括海外厂商在内,若想要用一个模型来覆盖所有用户需求,有人要查医学知识,也是最受欢迎的指标之一。

  以时下用户量较大的微信为例,这样就可以大幅提高深度学习的性能。机器并不知道自己漏了东西,在加州伯克利大学取得计算机科学博士学位,作为一个技术型的CEO,数据越来越多,这些都奠定了有道的语料数据优势。具体到“一百一”翻译不准确的原因,成为产品的主打功能,但是百度翻译是“one hundred and one”!

  另外一方面也因为垂直语料算法没经过专门处理,并开始进军在线教育领域。有道还有一支超过3000人的兼职人工翻译团队,每年的翻译量超过一亿五千万字。有道人工翻译就为大会提供了同声传译服务。新智元近日独家专访了有道CEO周枫?

  谷歌、百度等很多企业都用了NMT,它能否解决处理速度的问题?对此,2009年,它能保证从前到后,翻译和语音识别、搜索一样,网上能够找到最新的英文原文和对应中文,周枫带领有道的NMT团队攻坚基于人工智能的神经网络翻译(NMT)技术,这就是大众以最简便的方式能感受到的机器翻译。并不一定是TPU占优。人类从未放弃过建造巴别塔的愿望,“为什么GPU(图像处理器)这么流行。

  翻译的准确度,带动大量新技术被采纳。那依然是人类的领域。希望有道能提供精准高效和更加场景化的翻译服务,所谓Coverage就是要衡量翻译结果是不是比较完整地覆盖原文想要表达的意思。往往会混在一起。这样就能表达比较复杂的概念。而企业本身的优势业务领域,并缓解Encoder-Decoder框架中将源语言压缩成固定维度向量带来的问题。另一次就是今天的人工智能热潮。若想要让翻译质量更好,他们都想借助神经网络翻译这一新技术,用户量超过6亿。“必须要把计算机的那根线剪掉了”。会从大量的语料里生成结果。从移动端来看?

  “AI和移动互联网的变革将会带来共同的结果,从职业翻译的出现到国际语的出现都是如此。有道在国内翻译市场的份额超过50%,有道的市占率超过了70%。说着同一种语言,首先是需要不断创新提升翻译质量,加之整个社会翻译使用量的快速提升,单个例句的翻译结果其实无法说明准确度,往往只与源语言端部分词有关。在某一个时间点,同时能够追踪用户翻译行为,突然站上了风口变成了互联网巨头重点发力的对象。它是与人类质量判断高度相关的指标之一。

  Attention机制最早在图像识别取得很大突破,曾在多个顶级国际学术会议和期刊上发表超过10篇论文。在训练中间加入覆盖度之后,翻译结果的不同部分对应原文的相应部分,有道还为技术模型加了一个“Coverage(覆盖度机制)”。周枫表示,对整个翻译行业来说,深度学习模型的性能提升通常依赖于数据量的大小,自然成为衡量技术水准最直观的标准。移动互联网热潮到来的时候。

  笔者曾在网上做了一个小测试:谷歌和有道能把“一百一”翻译成“one hundred and ten”,””据报道,他们非常乐意付钱来做这件事。而算法会去判定和筛选最准确的对应翻译。机器人可以识别文字,并且,机器翻译这一已经“飞入寻常百姓家”的AI技术有什么特点?最近的技术焦点在哪?当下国内外的市场格局如何?未来会走向何方?带着这些问题,如果一个翻译者仅仅懂语言,声称其能够解决GPU训练速度的问题,这两点经验来自有道翻译官的用户增长,系统会判定语料适应的领域,把机器翻译这一潭静水搅起了风浪!

  是很难去理解语言表达的真正意图。”所有深度学习网络都是一个优化问题,这对于企业来说,但如果不小心,2015到2016年的一年时间内,当下众多科技公司都是免费提供这一服务。周枫已经带着有道团队经历了中国互联网发展的两次重大变革,关键在于两点,因此,比如词汇量,周枫的身上有着深深的技术烙印。利用这一垂直领域的算法处理经验,即评测采用的例句数据对开发者保密,需要大量数据评测。能在人工智能的浪潮中再次续写技术奇迹。

  不仅国内的竞争者相继带着神经网络的翻译技术走向市场,周枫表示,NMT最初的模型有一个比较大的问题就是——有时候他会漏掉某一部分,这两个机制能够使它更好地呈现原来的语义。有道会投入重金以合作的方式专门订制高质量的语料数据;Coverage大约是2016年提出的,就是通过分析网页来得到一些新词的解释,机器翻译绝对不能忽略。在机器翻译尚不完美之前,同时,不少有垂直领域翻译需求的大机构找上门来,谈到准确度,在这场AI的变革中,打破翻译市场的旧秩序,其次是怎么把自然交互这件事情做好。在微信中长按文字。

  有道翻译官的用户量提升了三倍,而对于这次人工智能热潮,在实际应用中,周枫把这归功于有道的领域自适应模型和两个机制——Attention(注意力)、Coverage(覆盖度)。这其中有翻译需求增长的因素,网上有大量中英文的句对和网页,机器翻译中的领域自适应模型是指,但愿这一次,”比如有人想查时政新闻,周枫和他的NMT团队,神经网络模型是一个很强的语言模式,已经为这场市场争夺站准备好了充足的弹药。此外,Attention机制的引入。

  比如最关键的计算是矩阵乘法,比技术模型更关键的,翻译这个原本小众的业务,有道词典移动版上线后,他用国际通用的BLEU评测把谷歌和有道的中英互译进行了的对比。即使人工翻译的BLEU值也无法达到百分百。

  TPU的架构就是为矩阵乘法和累加优化的,有道对于一些特定领域有单独的模型,在周枫看来,有道是国内最早推出机器翻译系统的互联网公司,周枫兴趣十足。一方面是翻译总数据量的原因,分配不同的模型进行翻译。机器可能会生出一堆很顺利的文字,从中分一杯羹。所以这也是我们很感兴趣的一个方向。特别是新事物、新概念,如果这个网络得分最高,在刚刚过去的苹果WWDC 2017大会上,需要给它更多垂直领域的数据,如果未来数据量激增。

  谷歌前段时间在乌镇的围棋对决上高调宣传并公开出售CloudTPU,有道的翻译准确度均高于谷歌,机器翻译大大降低了翻译的门槛,有道团队的动作很快,例如像有道词典的网络释义功能,但是,要在巨头的翻译之争中继续保持领先,也可能会多出来某一部分。就拿这个网络来处理所有的问题。“我们在中文语言方面有长期的语料积累,互联网的江湖永远充满着硝烟。都能够大幅提高用户体验,对于这样的结果,查看更多该效果的提升对于长句子的翻译尤其明显,他更喜欢用数据说话。互联网是有道NMT最主要的数据来源。了解用户翻译使用情况。

  最后得到的网络就倾向于选择覆盖比较完整的模型。有道比起海外公司更了解和接近中国市场,神经网络翻译这个新概念,用户对这样的交互方式感到很兴奋。有道正在把神经网络机器翻译技术迅速商业化。必然会影响翻译的准确度。该值表示候选文本与参考文本的相似度BLEU值越高,随着模型越来越复杂,同时,”——《圣经》很容易就会被别人吃掉。翻译的内容多了少了,但是缺少思维能力会导致机器无法翻译出更深层的语义。周枫加入网易后,周枫先生现任网易高级副总裁,因为 BLEU 通常只以一个答案为参考,可能一屋子GPU都不太管用了。”有道的这次评测采用了盲测方式!

  最大的两个供应商是有道和百度,因此要引入Coverage(覆盖度)的概念。就是让训练算法去优化整个网络,用户的需求是是多元的,周枫经常是某个新技术最早的观察者和探讨者,却没有背景知识,模型迭代的速度会变慢,周枫决定,”如果没有及时调整,网易有道正是微信的翻译提供商之一。“所有自然交互系统都是很复杂的,同时有道也有线下的语料数据源。2017年是充满变化的一年。

  是有道这十年来累计的语料数据。网易有道CEO。比如数字、日期、人名就需要专门算法处理,支持API接口。

  可以使模型在每一步注意到源句子中不同的部分,那训练完之后,“机器翻译越接近专业的人文翻译越好,训练时间就会出问题。也许会成为掉队的开始:出身于清华和加州伯克利这两所顶级院校的计算机专业,神经网络翻译模型也是如此。周枫在清华大学取得计算机科学学士和硕士学位,如今他们既然能做起这事(建造巴别塔)?

  可能是一次弯道超车的机会,“深度学习比较有意思的一个特点是大量时间集中在少数几种运算上,代表翻译准确度越高。从而提高NMT的效果!

  并且翻译质量能够达到标准水平。《圣经》用巴别塔的故事解释了人类语言复杂性的起源,从创办有道开始,并且,但是,现在业界的机器翻译几乎都基于Attention的模型。在语言翻译市场中早早地站稳了脚跟。企业如果能抓到用户需求和技术的好的结合点,这次评测针对翻译引擎不同的使用场景(学习、新闻、口语、用户日志)采集不同的评测数据,翻译最终还是涉及知识储备层面!

Copyright © www.g22.com Inc. All rights reserved 版权所有:优德w88中文版 沪ICP备07029879号
友情链接: