容联云知识图谱Demo论文被数据挖掘顶级国际会议CIKM 2022录用

图灵汇官网

近期,国际顶尖学术会议CIKM公布了2022年度演示论文入选名单,容联云人工智能实验室与南开大学携手合作的《DASH:一个灵活的知识图谱系统,解构需求、算法、数据来源与人类角色》一文荣获入选。

自1992年起,CIKM作为信息检索与数据挖掘领域的顶级学术盛会,汇聚了全球顶尖学者与研究者,共同探讨前沿科技与理论。

在人工智能蓬勃发展的当下,知识图谱作为理解与整合多元异构数据的关键工具,成为行业焦点。通过“数据->知识->知识图谱”的转换路径,有效支撑了智能问答、信息检索、内容推荐、金融风控、精准营销等多样化应用。

头部互联网企业如谷歌、百度、微软等凭借其“数据-业务-技术”闭环体系,已成功构建通用知识图谱,并将其应用于实际业务中。相比之下,众多企业更侧重于打造领域特定知识图谱以满足特定业务需求,这类知识图谱注重深度知识挖掘,被视为未来增长潜力的重要领域。通过知识图谱技术量化与描绘物理世界中的生产要素、业务活动、知识与规则,企业得以构建数字孪生智能体。

然而,构建与应用领域知识图谱对多数中小企业与非互联网企业而言,仍面临技术与成本双重挑战:

  1. 构建阶段:如何适应快速变化的知识类型与模式,如关系、事件、观点等?
  2. 应用阶段:复杂业务场景下,如何处理多步推理与数值计算等高级查询需求?
  3. 依赖问题:如何减少对人工标注的依赖,实现对新业务、新场景的快速响应?

针对以上挑战,通用知识图谱的成功案例难以直接适用于多数企业。因此,构建高效、经济的知识图谱解决方案显得尤为重要。

为解决这些问题,《DASH》提出了一种创新理念——“解构需求、算法、数据来源与人类”,旨在知识图谱构建与应用过程中实现“业务、算法、数据、人力”的分离,最大化算法标准化,降低企业接入知识图谱的技术壁垒。在此基础上,容联云研发出一款低成本、易于迁移的敏捷知识图谱系统。

该系统融合了基于多轮机器阅读理解的知识抽取(MRC-KE)、层次化知识图谱问答(Hi-KBQA)等先进算法与半自动数据收集方法,具备高度的可移植性和准确性,能在面对新业务、新场景时快速适应少量或无样本情况,显著降低对人工标注的依赖,实现快速部署。同时,系统支持用户根据业务需求灵活输入“行业知识、业务知识”,实现人机协同操作。

此知识图谱系统是容联云“通信+AI”双引擎驱动下的创新成果,有力推动了公司在自然语言理解、认知智能等领域的技术进步。未来,容联云将继续深耕AI算法研发,深化与场景应用的结合,以前瞻技术为企业的数字化转型提供强大动力。

本文来源: 图灵汇 文章作者: 孟宪辉