看文本知语义:谷歌推一步到位自然语言理解框架SLING

看文本知语义:谷歌推一步到位自然语言理解框架SLING | 论文+代码 ...

叶露珠

2018-08-19 21:04:08

谷歌近期发布了一种全新的自然语言理解系统——SLING，彻底改变了传统的自然语言处理流程。传统的自然语言处理系统通常采用一系列分析步骤，如词性标注、句法依存分析和语义表示计算，这些步骤彼此独立，容易导致错误累积。而SLING则通过直接分析文本，生成语义框架图示，从而避免了这一系列问题。

SLING利用循环神经网络（RNN）直接从文本生成语义框架图示。该图示能够捕捉到文本中的关键语义元素，如实体、时间、地点等，并将其组织成一系列插槽，每个插槽有自己的角色和值。这种结构不仅提高了处理效率，还能减少错误的传播。

例如，对于句子“许多人都声称自己曾预测过黑色星期一。”SLING能够识别出“许多人”、“预测”和“黑色星期一”等关键信息，并将它们分别放入相应的语义角色插槽中。具体而言，“预测”这一动作会与“许多人”和“黑色星期一”分别关联，形成一个完整的语义框架图示。

框架语义学是一种将文本的意义表示为一组形式语句的方法，每种形式语句称为一个“框架”。SLING使用框架语义分析来生成语义框架图示，这种方法能够处理复杂的语义任务，如指代、隐喻和借代等。框架图示通过插槽相互连接，能够灵活地捕捉到各种语义信息。

SLING通过优化易引发兴趣的语义框架，训练了一个RNN。在训练过程中，SLING使用了TensorFlow和DRAGNN等工具。SLING的内部架构采用了编码器-解码器设计，通过简单的词汇特征（如单词、后缀和标点符号）将输入文本编码为向量，然后使用这些向量和循环特征来计算框架图示的更新序列。

在推理阶段，SLING能够快速生成语义框架图示，提供高效的图示存储和执行RNN的JIT编译器。尽管目前SLING仍在试验阶段，但其性能已经相当出色，在普通台式机CPU上达到了超过2500 token/秒的分析速度。

SLING是用C++编写的，并且开源。有兴趣的研究人员可以在GitHub上找到相关代码：https://github.com/google/sling。此外，关于SLING的详细论文可以在arXiv上找到：https://arxiv.org/abs/1710.07032。

希望以上信息对您有所帮助！如果您有任何疑问或需要进一步的信息，请随时联系我们。

自然语言语义一步到位框架文本理解代码论文 SLING 谷歌推

本文来源：图灵汇文章作者：叶露珠