百度的人工智能要先让机器听懂自然语言

图灵汇官网

近期,科大讯飞和百度在语音识别方面取得了显著进展。尽管人工智能领域的科学家很少担心机器会统治世界,但他们深知开发高效的语音识别系统所付出的努力。谷歌、百度和微软等公司都在积极研究这一领域。

百度美国研究院AI实验室主管Adam Coates向我展示了他们最新的语音识别产品。当他说出“我想听柴可夫斯基”时,输入法立即准确地将这句话转化为了文字。他提到,虽然许多输入法都有语音输入功能,但通常不被广泛使用,因为它们的识别效果不尽如人意。然而,百度正致力于提升语音输入的速度和准确性。

大约两年半前,Adam从斯坦福大学毕业后加入百度,专注于深度学习在语音识别中的应用。起初,他们主要开发了英语版本的语音识别系统。通过深度学习,系统需要大量的语音数据进行训练,以便在听到不同语句时能准确识别。

“我们训练了大量的英语数据,成千上万小时的音频。”Adam解释道。到2015年中期,他们成功开发出了实验室版本,随后花了一年多时间将其转化为产品,并在安卓平台上发布。尽管有人质疑在一个中国公司开发英文语音识别工具的意义,但Adam和他的团队发现,使用深度学习的方法,开发中文识别版本并非难事。

与传统机器学习路径不同,深度学习只需将中文语音数据输入现有算法中进行训练,就能实现中文识别。目前,百度语音系统不仅支持普通话,还能处理中英文混合语境,例如在语音识别中自动转换英文名字。

深度学习技术在多个领域展现出巨大潜力。谷歌大脑负责人Jeff Dean指出,谷歌正在将其应用于自然语言理解和机器感知、医疗以及机器人等领域。百度AI实验室也致力于将深度学习技术用于自然语言识别和理解,以满足中国市场的需求。

尽管百度在语音识别方面取得了一定成就,但仍面临不少挑战。例如,机器需要更好地理解上下文,才能准确识别孤立的词汇或替换的词。此外,语音识别是实现诸如自动驾驶和AI医疗等应用场景的基础。

百度下一步计划将精准的语音识别技术应用于更多场景。除了百度,许多创业公司也在自然语言处理领域崭露头角。例如,专注于自然语言处理的美国公司X.AI已经筹集了大量资金。在中国,科大讯飞和思必驰等公司也取得了显著进展。

尽管创业公司在数据方面面临挑战,但通过雇佣人员收集数据或购买数据等方式,这些问题是可以解决的。Adam指出,真正的挑战在于将这些技术与用户需求紧密结合,开发出能够影响亿万用户的产品。

人工智能时代已经到来,它不仅仅体现在科幻电影中的场景,而是从改变人机交互方式开始,逐步渗透到日常生活中。专用人工智能的应用,如医疗诊断和自动驾驶,正逐渐改变我们的生活。各大科技公司纷纷投入这一领域,试图利用深度学习技术引领未来的发展。

本文来源: 图灵汇 文章作者: 姚劲波老乡