您的位置:www.85058.com > 技术支持 > 网易有道AI开放日聚焦人工智能 发布“翻译王”

网易有道AI开放日聚焦人工智能 发布“翻译王”

发布时间:2019-10-22 08:07编辑:技术支持浏览(140)

    网易有道近年来在教育领域发展很好,AI技术的加持也进一步加快其步伐。网易有道是目前国内用户量最大的互联网教育品牌之一,服务中国互联网8亿用户, 有道词典用户在2018年初刚刚突破7亿大关。旗下拥有包括网易有道词典、有道精品课、有道翻译官、有道云笔记等大众教育的工具类和在线学习类产品。

    2018年9月6日下午,网易有道在京举办了“2018网易有道AI开放日暨智能翻译硬件二代发布会”,与业内开发者、合作伙伴和媒体记者齐聚一堂,就有道AI技术及开放赋能进行了深入交流,并现场发布了一款重磅AI硬件新产品:有道翻译王2.0Pro。

    有道AI技术总监林辉介绍了有道智云面向手机和智能硬件的解决方案。首先是机器翻译,有道智云提供拍照翻译、原图翻译、AR翻译三种功能。在智能交互方面,有道云提供语音助手和有道魔镜(智能识别物体)。

    本文属于原创文章,如若转载,请注明来源:网易有道AI开放日聚焦人工智能 发布“翻译王”http://dcdv.zol.com.cn/697/6975983.html

    此外,以上功能也能离线处理。为了实现这个效果,有道做了,模型定点化、模型量化、在CPU方面做了指令级别的优化、自研的离线运算库、与芯片厂商合作优化,做到了识别50个字只需要50毫秒,如果字数比较多的话,每增加50个字只要增加15毫秒。

    www.85058.com 1网易有道副总裁刘韧磊发布智能翻译硬件二代

    有道以自己在教育、翻译上的积累切入AI,虽然来得晚,但是他们的发展却很快速。但是雷锋网也注意到,有道目前的AI产品,少有原创,翻译机、AI口语测评、AI批改试卷等都是行业内已经有的模式,网易如何在这些产品上破局呢?

    发布会上同时公布了上一代有道翻译蛋从去年10月上线以来的销量,累计销售超10万台,并在京东和严选两大电商平台上收获了用户一致的满意口碑。

    第二个技术,基于OCR的图像翻译方案。OCR技术是指在照片里面来找到文字区域,同时把文字识别出来,这个技术可以和翻译技术一起来用,也可以作为一个独立的技术用在其他场合,比如文档的电子化。

    通过本次AI开放日,网易有道以行业前瞻的视角梳理了AI技术及应用的落地场景,着重强调了有道AI在教育领域、硬件厂商及办公方向的布局和能力。作为中国AI技术实践的先驱者之一,网易有道也将实现各项业务“AI+”的转变,以更优质的AI技术服务合作伙伴及消费者,营造一个AI技术驱动优化的新生态。

    拍照翻译是第二大特点,需要基于计算机视觉的OCR识别技术,还需要较大的屏幕来显示图像,目前科大讯飞、搜狗、网易三家也都在做。据媒体测评,讯飞翻译机2.0的屏幕小拍不全,容纳信息有限,需要进行多次翻页等繁琐的操作,搜狗翻译宝3.1寸高清屏幕体验更好,网易翻译宝此次也采用了3寸的高清屏。

    www.85058.com 2网易有道CEO周枫开场致辞

    第三个技术是语音识别、语言合成和对话系统。翻译王就用到了这些语音技术,能够进行汉语、英语、日语、汉语、葡萄牙等五种语言的语音识别和合成。有道也做了一些特色的项目,例如用机器学习用户上传的录音,只需十分钟的录音文件,就能合成相似的音色;以及离线语音功能。

    随后,有道AI团队还分享了基于有道整体技术输出平台——有道智云的“AI+三大行业解决方案”,以帮助教育、政企、硬件厂商三大行业解决痛点问题,其中很多技术更是首次向行业展示。目前,有道智云已实现了包括文字识别(OCR)、语音识别(ASR)、语音合成(TTS)、神经网络翻译(NMT)在内的处于业界领先的四大核心技术手段。其中OCR技术当中全自动多语言混合识别、横竖斜排版面自动识别,可以轻松应对多种复杂场景的拍照翻译,在国内尚属首家。多语音识别和语音合成技术也在此次AI开放日亮相,只需提供10分钟的录音,有道语音合成技术(TTS)就能模拟出原声,合成效果与原声真假难辨,令人眼前一亮。另外,有道AI的终端侧离线技术亦有重大进步,离线神经网络翻译、离线语音识别和离线文字识别三大技术更是率先在此次推出的有道翻译王2.0Pro产品中率先应用,并通过智云平台同步开放给业内开发者。

    网易有道首席科学家段亦涛分享了有道AI核心能力。

    www.85058.com,网易有道与AI的渊源要追溯到2008年上线有道翻译,此后一直深耕于AI领域的技术和应用落地,至今已有10年历史。网易高级副总裁、网易有道CEO周枫在开场致辞中指出,新十年的红利将是人工智能技术,金融科技和物联网(IoT)。谈及有道的AI布局,周枫认为智能硬件是互联网面向消费新场景的设备延伸,有道智云则是面向合作伙伴的整合优化服务,强化这两部分能够使有道AI产品矩阵的布局和扩充更为稳健。

    接下来,有道AI技术总监黄瑾分享了有道智云在办公场景下的解决方案。首先是文档翻译,通过OCR技术,有道能识别文档结构、图片、表格、公式,10页4000词的英文论文PDF,1分钟内就能完成翻译。第二个是文档数字化,有道提供了一键导入图片、自动识别、文本审校、语义理解、文档终校等支持,实现中文标准印刷体99.9%识别率。

    作为此次AI开放日的亮点,有道全新智能翻译硬件二代-有道翻译王2.0Pro亮相。网易有道副总裁刘韧磊现场揭晓了此款融合了有道最新AI翻译技术和匠心设计的智能翻译硬件,与一代产品有道翻译蛋相比,翻译王的优势突出,不仅增设了英日韩三大常用外语与中文的离线互译功能,在线语音互译的语言包也拓展为43种,覆盖191个国家和地区。同时,翻译王结合了OCR识别技术,支持7种语言离线拍照翻译、21种语言在线拍照翻译,是目前市面上拍照翻译支持语种最多的翻译机。

    在数字化内容方面,有道OCR技术可以帮助纸质教育材料实现数字化,比如将试题收入电子库;在教育过程方面,有道推出了智能答题板、作业批改系统、AR拍照自动判题;在教育方法智能化方面,有道提出了英语语音跟读、口语评分、知识图谱等方案。以上方案也都可以通过有道智云接入。

    www.85058.com 3网易有道首席科学家段亦涛现场展示有道AI过去一年取得的成果

    原标题:详解网易有道AI战略,智能硬件、教育、办公三大解决方案

    最后,有道AI技术总监林会杰分享了有道智云在教育上的解决方案。在教育场景,有道提出了三套解决方案:面向数字化内容的解决方案、面向教育过程的网络化解决方案,以及教育方法的智能化解决方案。

    www.85058.com 4

    同时,在今年的发布会我们还了解到,有道将以AI和教育作为两大关键战略,在以AI能力赋能自己的C端产品的同时,也通过有道智云将AI技术能力开放给合作伙伴。返回搜狐,查看更多

    网易有道作为独立子公司,网易的AI布局与有道还是有很大区别。有道的核心AI能力有:神经网络翻译、OCR识别、语音识别和语音合成,都是由有道团队独立研发。周枫告诉雷锋网:有道现在业务端定位就是A和教育两个关键战略,教育目前在有道的营收中已经占到超过一半的份额,其次是广告。有道的规模不是最大的,因此在业务上得有明确定位,结合自己的能力、资产和行业趋势,AI和教育是最适合有道的,且这两个方面也有所交叉,AI对教育能有极大提升。

    OCR识别技术的难点在于一些复杂的场景,例如图像角度倾斜、手写识别、混合多语种等,目前有道OCR技术能处理19种语言。

    2018年4月17日,网易有道宣布完成首次战略融资,此轮融资由慕华投资领投,君联资本参投,投后估值达11亿美元,跻身中国互联网独角兽俱乐部。至此,网易已经拥有三家独立融资的品牌:网易云音乐、网易味央、网易有道。网易有道CEO周枫告诉雷锋网,由于网易占据网易有道超过50%的股票,网易有道依然是网易旗下子公司。

    关于这一点,周枫谈到,“回到我们4月份说的一句话,我们希望做教育领域最懂AI的公司,同样也是希望做AI公司里最懂教育的公司。所以看的是综合能力,不管是从相关的团队的规模上、投入上,以及说做相关技术的时间和数据积累等等方面,综合来看,我们还是比较有信心的。具体到某一个上面的话,有些事情可能我们做的会晚一些,但是总体上是长跑,所以我们还是挺有信心,说每一个领域都能做很好。

    在2017年,科大讯飞已经靠着语音成为市值逼近千亿的巨头,BAT也都已经布局语音技术多年,有道这个时候进入显然有些晚。但是在周枫看来,有道做AI能够立刻找到大的场景作为验证过程,比纯做toB的公司迭代周期和最后出来的产品的第一版第二版产品的品质要好很多,总体上有道是比较垂直的业务形态。

    我们先来看看这次发布会上的全新硬件——有道翻译王 2.0 Pro,这款翻译机集成了有到啊的多项AI能力。

    9月6日下午,网易有道在北京举办“2018网易有道AI开放日暨智能翻译硬件二代发布会”,向媒开发者、合作伙伴、媒体记者介绍了网易有道AI战略和AI核心能力、有道智云在教育/办公/智能硬件三大行业解决方案,同时还发布AI硬件新产品:有道翻译王2.0 Pro。

    有道AI技术的围绕着语言这一条主线展开,解决各个场景下的语言处理问题。第一个技术,神经网络翻译。在机器翻译这个领域,有道已经耕耘十年,经历了从SMT统计翻译模型到神经网络翻译模型的迭代,目前有道的神经网络翻译模型支持7种语音的中文互译,还支持英文与印尼、阿拉伯语等语言的互译。据陈,有道词典海外版U-Dictionary已经超越其他竞争对手,在印度市场排行第一。

    2011年,网易开始布局AI,由浙江大学计算机博士李晓燕牵头,在内部储备相关技术和团队,为游戏、邮箱、音乐、云服务和电商等业务提供AI支持。不过,当时的AI还没有因深度学习而突飞猛进,AI还无法上升到集团战略层面。

    “翻译王”还有一个特点是加入了语音助手,以“你好,有道”唤醒,支持语音指令(可进行音量、屏幕亮度调节),语音交互问答;可询问古诗(500首中小学生常用古诗词、2万首唐诗宋词古诗集)、百科(数百万百科词条)、翻译结果、天气(可查询当天和未来2天的天气)、汇率(可查询实时汇率,交易时以银行柜台成交价为准)、计算结果。

    我们先回顾一下网易有道翻译技术发展历史:

    此外有道做AI还有几大特点。第一个特点是,同时注重C端和B端,C端就是网易有道的词典、翻译、课程等产品,B端则是通过有道智云输出;第二个特点就是,同样重视云端和终端AI能力的发展,除了智云之外,有道也开发出了很多离线的终端AI能力,例如AR实景翻译完全依靠端侧;第三个特点,有道重视实际的场景和领域,例如现在大力发展的政企、教育、办公等三个场景。

    有道翻译王2.0 Pro

    www.85058.com 5

    www.85058.com 6

    段亦涛也谈到,“语音识别是一个例子,我们语音识别起步比较晚,但是我们很快就追上来。像刚才那几个例子,包括作文批改,这里面很多东西真的要说透的话,它依赖于很多自然语音处理的积累,比如我们做作文批改项目时候,我们大量应用到我们翻译技术,这里面有翻译模型在里面。我们会在了解清楚问题本质后,把这些问题拆解成我们现有技术可以解决的方式。很多事情还是看积累是不是足够深厚,是不是对这个问题有比较好的理解。”

    本文由www.85058.com发布于技术支持,转载请注明出处:网易有道AI开放日聚焦人工智能 发布“翻译王”

    关键词: