在自然语言处理领域,哪些企业的发展遥遥领先?

图灵汇官网

AMiner今日发布了《自然语言处理研究报告》,您可以通过微信公众号直接下载该报告。为了便于大家学习,我们提供了精简版和详解版。

自然语言处理是一门涵盖计算机科学、语言学和心理学等多个学科的交叉学科,各学科之间相互关联。

1950年,图灵提出了著名的“图灵测试”,这被视为自然语言处理思想的开端。从20世纪50年代到70年代,自然语言处理主要采用基于规则的方法。

70年代以后,随着互联网的迅速发展,自然语言处理的思想从理性主义转向经验主义,基于统计的方法逐渐取代了基于规则的方法。

从2008年至今,受图像识别和语音识别领域成果的推动,人们开始利用深度学习来研究自然语言处理。从最初的词向量到2013年的word2vec,深度学习与自然语言处理的结合达到了顶峰,并在机器翻译、问答系统、阅读理解等领域取得了显著的成功。

接下来,AMiner将介绍自然语言处理在各大企业的应用情况。

微软亚洲研究院

微软亚洲研究院成立于1998年,主要研究内容包括多国语言文本分析、机器翻译、跨语言信息检索和自动问答系统等。这些研究项目已经开发出一系列实用成果,例如输入法编辑器IME、对联游戏、Bing词典、Bing翻译器、语音翻译和搜索引擎等,极大地推动了微软产品的进步。此外,微软还在自然语言处理顶级会议如ACL、COLING上发表了大量论文。

语音翻译

2017年,微软在语音翻译上全面采用了神经网络机器翻译,并推出了Microsoft Translator Live Feature。这项技术能够在演讲和会议期间,实时同步地将发言者的讲话翻译成多种语言。微软还计划将知识图谱纳入神经网络机器翻译中,以增强语言理解能力。

人机对话

小冰目前拥有超过1.4亿用户,在数十亿设备上进行交流,覆盖十几种语言。小冰正在尝试将各国语言的知识融合在一起,实现一个开放语言自由聊天的过程,目前支持中文、日文和英文,拥有上亿用户。

Google

Google是最早研究自然语言处理技术的团队之一,作为一个以搜索为核心的企业,Google在自然语言处理方面投入了大量资源。Google的数据量庞大,能够搭建丰富的数据库,为其研究提供强有力的数据支持。Google在自然语言处理方面的研究重点在于大规模应用、跨语言和跨领域的算法。

机器翻译

Google的知识图谱技术处于领先地位,例如自动挖掘新知识的准确性、文本中命名实体的识别、纯文本搜索词条到知识图谱的结构化搜索词条转换等,效果均领先于其他公司,并且许多技术已经产品化。

语音识别

Google致力于语音搜索技术的研发,并与苹果公司的Siri展开竞争。自2012年起,Google将神经网络应用于这一领域,显著降低了语音识别的错误率。2011年,Google收购了语言信息平台SayNow,并在2014年收购了SR Tech Group的多项语音识别相关专利。

Facebook

Facebook涉足自然语言处理较晚,2013年开始发展语音翻译,2015年开始进行语音识别的研发。

语音翻译

Facebook的语音翻译发展路线如下:

语音识别

2015年,Facebook建立了语音识别和对话理解工具,开启了语音识别的研发之旅。2016年,Facebook开发了一个响应“Hey Oculus”的语音识别系统。2018年初,Facebook开发了wav2letter,这是一个高效端到端的自动语音识别系统。

百度

百度自然语言处理部是百度最早的部门之一,研究涉及深度问答方向。百度在深度问答方面积累了问句理解、答案抽取、观点分析与聚合等方面的技术,并已在搜索、度秘等多个产品中应用。百度翻译目前支持28种语言,覆盖756个翻译方向,支持文本、语音、图像等多种翻译功能,并提供精准人工翻译服务,发布了世界上首个线上神经网络翻译系统,并获得了2015年度国家科技进步奖。

阿里巴巴

阿里巴巴在其产品中广泛应用自然语言处理技术,如构建知识图谱以实现智能导购,进行全网用户兴趣挖掘,并在客服场景中运用自然语言处理技术打造机器人客服。阿里巴巴的机器翻译与其国际化电商规划紧密相连,2017年正式上线了自主开发的神经网络翻译系统,进一步提升了翻译质量。

腾讯

腾讯的人工智能实验室AI Lab的研究领域包括计算机视觉、语音识别、自然语言处理和机器学习等。腾讯文智自然语言处理基于并行计算、分布式爬虫系统,并结合独特的语义分析技术,能够满足自然语言处理、转码、抽取、数据抓取等需求。

在机器翻译方面,2017年腾讯宣布翻译君上线“同声传译”新功能,用户边说边翻的需求得到了满足,语音识别+NMT等技术的应用保证了边说边翻的速度与精准性。

京东

京东在人工智能领域也不甘落后。京东AI开放平台主要由模型定制化平台和在线服务模块构成,其中在线服务模块包括计算机视觉、语音交互、自然语言处理和机器学习等。京东规划了NeuHub平台作为普惠性开放平台,不同角色均可找到适合自己的场景,例如通过简单的代码即可实现对图像质量的分析评估。从业务上来说,平台可以支撑科研人员和算法工程师不断设计新的AI能力以满足用户需求,并深耕电商、供应链、物流、金融、广告等多个领域应用,探索试验医疗、扶贫、政务、养老、教育、文化、体育等多领域应用,聚焦新技术和行业趋势研究,孵化行业最新落地项目。

科大讯飞

科大讯飞成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级骨干软件企业。科大讯飞作为中国智能语音与人工智能产业的领导者,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的地位。科大讯飞成立之初就开始在语言和翻译领域布局项目,基于深度神经网络算法上的创新和突破,在翻译方面取得了显著进展。

本文来源: 图灵汇 文章作者: 廿五科技