在日常生活中,“刷题”是贯穿始终的一种活动。有些题目可以独立完成,比如考试题;但是像面试这种需要互动的题目,一个人往往难以应对自如。
这种互动不仅限于普通的问答,还需要“陪练方”在特定情境下对问题进行回答,并引导对方进行思考,从而达到最终目标。例如,面试官不仅会提问,还会引导应聘者表达他们对问题的理解和解决方案。这类问题通常是开放性的,比如自我介绍等。
AI的目标是替代人类能完成的所有事情,而“面试陪练员”正是其中的一部分。然而,当前的自然语言处理领域并未充分重视这种能力,并且实现起来相当困难。
最近,谷歌在其官方博客上介绍了一项重要的自然语言理解(NLU)能力——自然语言评估(NLA)。这一技术旨在帮助人们更好地理解和准备面试,尤其是在教育领域。
自然语言评估(NLA)旨在根据一系列期望来评估用户提供的答案。比如,在一个与学生互动的NLA系统中,其工作流程包括:
通过NLA,对答案的期望和评估可以非常广泛,从而提升师生之间的互动效果。
即使是那些有明确答案的问题,NLA也可以进行更为细致的评估。例如,假设问题是对霍格沃茨的描述,期望答案是“霍格沃茨是一所魔法学校”。如果学生回答“我不是很确定,但我认为这是一所学校”,这样的回答可能会被认为过于笼统,并且缺乏自信。
这种细节化的评估有助于学生在会话环境中建立技能。
在很多情况下,提问者并不期望得到具体答案。例如,如果问题是“请进行自我介绍”,提问者更关心的是回答的相关性、简洁度和流畅性。
在这种情况下,一个有效的评估输出会将用户的答案与相关主题进行映射,比如教育背景、经历和兴趣等。这对于自然语言处理来说是一个挑战,因为答案可能很长,主题也可能混杂在一起。
主题性NLA(Topicallity NLA)是一个标准的多分类任务。谷歌的解决方案是将每个主题分解成细粒度的组件,并利用大型语言模型(LLM)进行识别。这种方法简化了数据收集过程,使得开发者可以轻松地训练模型。
这些基本问题是通过迭代的手工过程设计的,确保模型能够捕捉句子内的语义。此外,这种设计允许模型在训练一次后,不断添加新的问题和主题,而无需收集特定主题的数据。
为了探索NLA的实际应用场景,谷歌的开发者创建了一个名为Interview Warmup的新工具。这个工具帮助求职者在IT支持和用户体验设计等领域为面试做准备。
求职者可以在家中练习回答行业专家提出的问题,从而在真实的面试中更加自信和从容。该工具并不对答案进行评分,而是为用户提供一个独自练习的环境,并帮助用户自我改进。
每当求职者回答一个面试问题后,该答案会被NLA模型逐句解析,用户可以查看不同话题的反馈,从而改进答案。
目前,Interview Warmup已经帮助了全球各地的求职者,并且开发团队正计划将其推广到更多地区,以帮助更多人找到理想的工作。
自然语言评估(NLA)是一项具有挑战性和前景的研究领域。通过细致入微的评估和分析,NLA促进了学习,并通过与社区的合作,为用户提供了自我评估和改进的机会。