自然语言处理(Natural Language Processing,简称NLP)是一种使计算机能够理解和生成人类自然语言的技术。在RPA(Robotic Process Automation,机器人流程自动化)的应用中,NLP主要应用于以下几个场景:
非结构化信息处理:当机器人接收到的信息不是结构化的数据字段或扫描图像,而是人类自然语言表达的文字时,NLP可以从这些文字中提取关键信息,并自动录入系统或与系统中的信息进行对比。
文本优化处理:OCR(Optical Character Recognition,光学字符识别)技术识别信息后,NLP技术可以进一步优化文本,找出最符合逻辑的词汇,进行文字修正。
信息检索与分类:当需要处理大量信息时,RPA可以借助NLP进行信息检索或分类处理。
自然语言反馈:NLP技术还可以在RPA处理完成后,以自然语言的形式反馈给用户。
NLP主要由两部分组成:自然语言理解和自然语言生成。
自然语言理解:其主要目的是帮助机器更好地理解人类的语言。
自然语言生成:其主要目标是帮助机器生成人类能够理解的语言。
NLP技术在很大程度上依赖于语言特性,例如,由于中文和英文在词汇和语法上的差异,导致NLP所采用的算法技术也有所不同。
在自动化应用领域,NLP不仅可以配合RPA使用,还可以与OCR技术结合,从而提高文字识别的准确性。例如,银行信用卡中心的RPA客服机器人会收到客户请求,如“明天,请将我的个人信用卡额度多调整1万元”。这句话需要借助NLP来解析和理解。
机器人结合领域知识,将这句话转化为业务信息。比如,“明天”指的是计算机获取的当前日期加一天;“信用卡”是主语;“我的”作为定语,可以根据客户的请求来源确定Customer ID;再通过Customer ID查询到具体的信用卡卡号;“额度调整”是动作;“1万元”是金额。因此,机器人最终获取的信息格式为{Customer ID: XXXXXX | Card No: XXXX-XXXX-XXX | Action: Credit Limit Adjustment | Amount: 10,000 RMB | Daytime: 2018-11-20}。接下来,机器人将自动打开相关界面,录入信息并执行相应操作。
虽然实际的自然语言理解过程可能更加复杂,因为自然语言中包含了大量口语现象,如省略、指代、更正、重复、强调、倒序等,但RPA的应用场景通常在商业环境中,话术相对规范且范围明确。为了配合RPA的应用,企业还可以从管理角度规范沟通话术。