第七届国际自然语言处理与中文计算大会(NLPCC 2018)公布了“单文本摘要”技术评测的结果,慧科讯业AI实验室(Wisers AI Lab)凭借其独特的自动摘要技术,在来自全球学术界和业界共计18支队伍的竞争中脱颖而出,荣获第一。
近年来,随着信息爆炸式增长,人们每天接触的文本信息量巨大,包括新闻、博客、聊天记录、报告、论文和微博等。从这些海量信息中提取关键内容变得愈发重要,而自动文本摘要技术提供了一种高效的解决方案。
单文本自动摘要技术通过计算机软件及其底层分析算法,从原始文本中自动生成简明、全面且准确反映文章核心思想的摘要,帮助用户快速阅读和检索大量信息。此外,这一技术还能通过对多个文本的分析,实现对同一事件的不同报道的多角度、多维度自动摘要。
慧科讯业(Wisers)在此次竞赛中获胜的技术结合了人工智能(AI)和自然语言处理(NLP),支持中英文跨语言自动摘要,采用无监督式生成技术,无需依赖训练数据,适用于多种类型的文本摘要。
该技术包含两个关键部分。首先,内容分析模块通过统计学和语言学特征,自动分析文本的主题,识别出最能概括文本讨论主题的关键语句。其次,摘要编辑模块经过精心设计,解决了传统提取式摘要上下文不连贯的问题,同时改善了生成式摘要的可读性。
慧科讯业AI实验室自动文本摘要技术的优势在于:
这项技术自2018年1月起已广泛应用于慧科讯业的产品后台,支持日常数据管理和运营。
除了在自动文本摘要评测中获得第一名外,慧科讯业AI实验室的自动话题分类技术也在“知乎问题自动标注”评测中表现优异,从16支参赛队伍中脱颖而出。该技术采用语义向量模型与深度学习结合的集成学习方法,并通过高效定制化工具快速支持话题扩展。
国际自然语言处理与中文计算大会(NLPCC)由CCF TCCI组织,每年吸引众多来自全球的自然语言处理和中文计算领域的专家和学者参加。第七届NLPCC 2018将于2018年8月26日至30日在中国呼和浩特举行。
NLPCC评测单元涵盖了自然语言处理和中文计算领域中的经典和新兴课题,受到学术界和业界的广泛关注和参与。本届评测任务于2018年1月公布并接受报名,3月启动,4月底提交结果,5月结束。每个评测任务提供一份训练数据集,由评测任务组织者根据严格设计的测试数据集和性能指标对参赛队的解决方案进行评估和排名。
慧科讯业AI实验室2014年在香港成立,专注于运用人工智能技术解决中文全媒体资讯自动化分析与大数据情报挖掘的问题。2016年4月,该实验室获得了香港特别行政区政府超过850万港币的创新科技基金。团队成员均毕业于国际知名院校,其中35%拥有博士学位。
慧科讯业AI实验室自主研发的AI分析技术覆盖了自动化媒体情报处理与挖掘的各个方面,包括基于文本分析的实体识别、关系提取、话题分类、情感分析和事件检测追踪等技术,以及基于图像分析的品牌标识和人脸识别技术。所有这些技术都可以在慧科讯业AI实验室官网(www.wisers.ai)提供的实时技术演示中体验。
点击文末“阅读原文”,即可免费试用慧科讯业的产品。
慧科讯业(Wisers)1998年成立于香港,是全球领先的全媒体大数据智能商业情报专家。凭借20年的海量媒体数据积累和先进的AI技术,慧科讯业为全球超过2500家企业和机构客户提供创新的产品和服务,帮助企业优化传播与营销效果、提升品牌价值、强化声誉管理、发掘市场情报、防范商业风险等。