龙泉寺位于北京西山凤凰岭山脚下,始建于辽朝应历初年,原本并不太出名。寺庙前矗立着两棵历经600多年的古柏,寺内还有一棵超过千年的银杏树。
这里隐居着一群高人,他们创造了一个会说话的机器僧人“贤二”。贤二不仅能够诵经和对话,还能唱歌,甚至卖萌。如果你问贤二:“贤二,我心情不好怎么办?”他可能会建议你读些好书。
贤二是全球首个“人工智能出家人”,身高60厘米,穿着黄色僧袍。他之所以能与人对话,得益于最新的自然语言处理技术。
自然语言处理是什么?
自然语言处理(NLP)是人工智能领域的重要分支之一。微软创始人比尔·盖茨曾表示,自然语言理解是人工智能领域皇冠上的明珠。自然语言处理包括语音识别、自然语言理解和语音合成三个方面。其中,语音合成技术可以将文本转换成语音,例如霍金的电脑轮椅所使用的技术。
科学家们已经实现了让电脑自主说话,例如微软小冰和贤二机器人。这些机器人的核心在于人工智能的语音合成技术。
自然语言处理主要包括六个步骤:获取原始文本、预处理、分词、词法分析、语法分析和语义分析。这些步骤分别解决了“听清”、“理解”和“回应”的问题。
自然语言处理的发展历程
20世纪80年代,人工智能科学家开始用统计模型来改进语音识别,提高了识别准确率。然而,直到2010年以后,深度神经网络的出现才大大提升了语音识别的效果。2013年,谷歌的语音识别系统对英语单词的识别错误率降至23%左右,2015年更是降至8%。微软也在2016年将单词识别错误率降至6.3%。
今天,语音识别技术已经非常成熟,例如科大讯飞的语音输入法可以在一分钟内完成400个汉字的输入。自然语言处理技术已经广泛应用到实际生活中。
自然语言处理的领军企业
科大讯飞成立于1999年,是中国自然语言处理领域的龙头企业。它在2008年成为人工智能语音产业界的第一家上市公司。2016年,科大讯飞的股价因人工智能热潮而飙升。2017年,科大讯飞的股价一度达到74.76元/股,市值突破千亿。
科大讯飞在成立初期也曾面临资金和市场的压力,但在艰辛的努力下,逐渐走向成功。2006年,深度学习的兴起标志着人工智能进入实用化阶段。从那时起,科大讯飞不断更新技术,取得了显著成就。目前,科大讯飞在全球语音市场份额中位列第四,仅次于谷歌、微软和苹果。
在终端消费者应用方面,科大讯飞的讯飞输入法用户已超过5.6亿,讯飞翻译机销售量接近数十万台,用户遍布全球130多个国家。
中国其他自然语言处理企业
除了科大讯飞,中国还有多家企业在自然语言处理领域有所建树,如百度、云知声和思必驰。这些企业大多具有深厚的学术背景。例如,思必驰的创始人俞凯是英国剑桥大学的博士,他推动了思必驰与上海交通大学的合作,研发出多项先进技术,如VDCNN抗噪算法和PSD新型解码框架。
尽管取得了诸多进展,自然语言处理仍然面临挑战,例如多语义现象的理解和方言的精确处理。但随着技术进步,这些问题有望逐步解决。
未来,随着自然语言处理技术的日益成熟,人工智能产品将更加智能,像贤二和尚这样的聊天机器人也将变得更加先进。