Google探索全新NLU任务自然语言评估，正式面试前让AI帮你热个身

刘帅政

2022-11-01 21:18:54

在日常生活中，“刷题”是贯穿始终的一种活动。有些题目可以独立完成，比如考试题；但是像面试这种需要互动的题目，一个人往往难以应对自如。

这种互动不仅限于普通的问答，还需要“陪练方”在特定情境下对问题进行回答，并引导对方进行思考，从而达到最终目标。例如，面试官不仅会提问，还会引导应聘者表达他们对问题的理解和解决方案。这类问题通常是开放性的，比如自我介绍等。

AI的目标是替代人类能完成的所有事情，而“面试陪练员”正是其中的一部分。然而，当前的自然语言处理领域并未充分重视这种能力，并且实现起来相当困难。

最近，谷歌在其官方博客上介绍了一项重要的自然语言理解（NLU）能力——自然语言评估（NLA）。这一技术旨在帮助人们更好地理解和准备面试，尤其是在教育领域。

自然语言评估（NLA）旨在根据一系列期望来评估用户提供的答案。比如，在一个与学生互动的NLA系统中，其工作流程包括：

通过NLA，对答案的期望和评估可以非常广泛，从而提升师生之间的互动效果。

即使是那些有明确答案的问题，NLA也可以进行更为细致的评估。例如，假设问题是对霍格沃茨的描述，期望答案是“霍格沃茨是一所魔法学校”。如果学生回答“我不是很确定，但我认为这是一所学校”，这样的回答可能会被认为过于笼统，并且缺乏自信。

这种细节化的评估有助于学生在会话环境中建立技能。

在很多情况下，提问者并不期望得到具体答案。例如，如果问题是“请进行自我介绍”，提问者更关心的是回答的相关性、简洁度和流畅性。

在这种情况下，一个有效的评估输出会将用户的答案与相关主题进行映射，比如教育背景、经历和兴趣等。这对于自然语言处理来说是一个挑战，因为答案可能很长，主题也可能混杂在一起。

主题性NLA（Topicallity NLA）是一个标准的多分类任务。谷歌的解决方案是将每个主题分解成细粒度的组件，并利用大型语言模型（LLM）进行识别。这种方法简化了数据收集过程，使得开发者可以轻松地训练模型。

这些基本问题是通过迭代的手工过程设计的，确保模型能够捕捉句子内的语义。此外，这种设计允许模型在训练一次后，不断添加新的问题和主题，而无需收集特定主题的数据。

为了探索NLA的实际应用场景，谷歌的开发者创建了一个名为Interview Warmup的新工具。这个工具帮助求职者在IT支持和用户体验设计等领域为面试做准备。

求职者可以在家中练习回答行业专家提出的问题，从而在真实的面试中更加自信和从容。该工具并不对答案进行评分，而是为用户提供一个独自练习的环境，并帮助用户自我改进。

每当求职者回答一个面试问题后，该答案会被NLA模型逐句解析，用户可以查看不同话题的反馈，从而改进答案。

目前，Interview Warmup已经帮助了全球各地的求职者，并且开发团队正计划将其推广到更多地区，以帮助更多人找到理想的工作。

自然语言评估（NLA）是一项具有挑战性和前景的研究领域。通过细致入微的评估和分析，NLA促进了学习，并通过与社区的合作，为用户提供了自我评估和改进的机会。

自然语言面试评估探索任务全新正式 Google NLU

本文来源：图灵汇文章作者：刘帅政

英伟达在自然语言生成领域的最新研究进展