如何用 Python 处理自然语言?(Spacy 与Word Embedding)

金正辉

2018-07-24 14:08:29

本文将指导你如何使用易于上手的工业级Python自然语言处理工具Spacy，对自然语言文本进行词性标注、命名实体识别、依存关系解析以及词嵌入向量的计算和可视化。

Spacy是一款强大的自然语言处理工具，其Slogan是“工业级别的自然语言处理”，意味着其性能强大且可靠。Spacy的数据表现来源于同行评审的学术论文，这使得它成为处理复杂文本任务的理想选择。

Spacy不仅具有高效处理文本的能力，还提供了丰富的文档和简洁的用户界面。安装过程简单，只需点击几个选项即可完成。Spacy支持多种功能，本文将展示以下内容：

接下来，我们将逐步介绍如何使用Spacy进行这些操作。首先，你需要准备好一个现代浏览器，无需在本地计算机上安装任何软件包。我们将通过一个在线实验环境来进行操作。

为了演示，我们选取了一段关于电视剧“Yes, Minister”的描述。这段文本将被用来展示Spacy的各种功能。我们将首先导入Spacy库，并加载相应的模型。接着，我们将使用该模型分析文本，提取词例并进行进一步处理。

以下是具体的步骤：

通过这些步骤，你可以深入了解Spacy的强大功能，并能够自行探索更多高级应用。希望这些内容能帮助你在自然语言处理领域取得更好的成果。

自然语言何用 Embedding 处理 Python Spacy Word

本文来源：图灵汇文章作者：金正辉

NLP通用模型诞生?一个模型搞定十大自然语言常见任务