自然语言处理全球专利计量分析

图灵汇官网

自然语言处理技术专利布局分析

引言

自然语言处理(NLP)是人工智能领域的重要分支,致力于开发能够理解并生成自然语言的技术,使用户能通过自己的语言与计算机进行交流。NLP主要涉及词汇分析、句法分析、语义和语用分析、文本分类、情感分析、自动摘要、机器翻译和社会计算等内容。NLP的发展经历了从基于规则的方法到基于统计的方法,再到基于机器学习(特别是深度学习)的三个阶段。

数据及方法

2.1 技术分解和数据获取策略

为了详细揭示NLP技术的发展情况,本文采用技术分解方法,将NLP细分为多个分支,并构建检索策略。本文将NLP分解为词法分析、句法分析、语义分析和语用分析四个主要分支。通过incoPat专利数据库,获取了2000年至2020年期间全球范围内的相关专利数据,共计80647项。

2.2 研究方法

本文采用专利计量分析方法,从整体和典型分支技术两个层面分析全球NLP专利布局。研究维度包括专利布局的整体趋势、技术优势国家的专利申请情况、技术优势机构的专利申请情况、有效专利分析、近三年申请专利分析和四方专利分析。本文使用Excel和Python等工具进行数据可视化。

自然语言处理技术整体专利分析

3.1 专利布局整体态势

自2000年以来,全球NLP专利布局呈现出平稳增长后加速增长的趋势。2012年以前,每年的专利申请数量约为2000项,而2012年后增长显著,2018年达到了8986项。中国在NLP专利布局上处于领先地位,其次是美国、日本和韩国。中国在专利申请数量上显著领先,2018年达到5623项,而美国在2017年达到2197项。从机构角度看,IBM在全球NLP专利布局中领先,其次是微软和谷歌,中国的企业如百度、腾讯和中国平安也有不错的表现。

3.2 技术优势国家/地区专利申请趋势分析

全球前十大专利布局国家和地区均表现出增长趋势。中国增长幅度最大,2018年专利申请数量达到5623项。美国紧随其后,2017年专利申请数量为2197项。日本的专利申请数量较为稳定,约为500项。韩国和其它国家也表现出一定的增长趋势。

3.3 全球优势机构专利申请趋势分析

国外机构在NLP专利布局方面起步较早,且保持稳定的增长。中国机构则在2010年后迅速崛起,尤其是中国平安公司在2018年布局了303项专利,增长了4.7倍,显示出中国企业在专利布局上的重视和投入。

自然语言处理典型分支技术专利分析

4.1 技术构成分析

机器翻译和语义学是NLP专利布局的主要方向,机器翻译技术的专利数量为5913项,语义学技术的专利数量为6341项。相比之下,情感分析、形态学和自然语言生成技术的专利数量较少。

4.2 典型技术分支各国专利布局及有效专利占比分析

在机器翻译方面,美国的专利数量和有效专利数量均最多,分别达到5913项和3096项。在语义学方面,中国专利数量最多,但美国的有效专利数量与中国相差无几。

4.3 典型技术分支优势机构专利布局及有效专利分析

IBM和微软在全球机器翻译和语义学专利布局中表现突出。中国企业在机器翻译方面表现不突出,但在语义学方面建立了初步的技术优势。例如,百度在全球语义学专利布局中排名第三。

结论与分析

本文通过对全球NLP专利数据的分析,揭示了NLP技术的专利布局态势。全球NLP专利布局呈现先平稳增长后加速增长的趋势,中国在专利申请数量上处于领先地位,美国在有效专利数量上领先。机器翻译和语义学是主要的专利布局方向,中国在语义学方面建立了初步的技术优势,但需加强国际专利布局。

本文来源: 图灵汇 文章作者: 代梦阳