北京数慧时空在青云科技 AI算力发布会的自然资源多模态大模型分享

图灵汇官网

青云科技专注于AI算力调度,通过构建开放生态系统,整合AI硬件、软件供应商、算法模型服务商、算力服务提供商及行业应用服务商等资源,深度整合算力、算法、行业数据与应用场景,旨在最大化释放AI的业务价值。

青云科技举办了AI算力发布会,邀请生态合作伙伴分享AI落地应用的技术与实践经验。北京数慧时空信息技术有限公司(简称数慧时空)作为受邀嘉宾之一,由卢宇航副总经理发表了题为《自然资源多模态大模型赋能多元领域应用》的演讲。演讲围绕数慧时空如何利用其自主研发的自然资源多模态大模型“长城”,支持多模态数据处理,打造“前店后厂”运营模式,应用于大规模影像处理、农业金融、以地控税等领域。以下是演讲主要内容概要:

关于数慧时空

  • 数慧时空是山东土地发展集团旗下的一家国家级高新技术企业,同时也是北京市的“专精特新”和瞪羚企业。
  • 自2019年起,数慧时空开始AI研发,自主研发了自然资源多模态大模型“长城”,并以此为基础开发了自然资源和空间地理SaaS平台“数慧云脑”。

自然资源多模态大模型-长城

  • “长城”大模型的架构设计分为四层:模型层、技术层、场景层和行业层。
  • 模型层基于样本、语料和网络模型构建,是大模型的核心基础。
  • 技术层涵盖数据标注、质检、语义分割、自然语言处理(NLP)和强化学习等关键技术。
  • 场景层涵盖了智能问答、图像变化检测、遥感影像自动校正等应用。
  • 行业层服务于自然资源、农业农村、城市管理等多个领域。

多模态数据处理能力

  • “长城”大模型支持多种模态数据处理,包括空间数据、文本、图像(如影像、视频、图片)。
  • 通过学习不同模态数据,模型能够理解和转换数据,如将空间数据描述为文字形式。

配合青云科技的算力支持

  • 数慧时空提供算法,青云科技则提供强大的算力支撑,结合多样化的数据输入,形成完善的大数据基础设施。
  • “长城”大模型参数已扩展至亿级,具备处理大规模数据的能力。

应用实例

  • 文本语言:基于LLaMA-2大语言模型的训练,实现智能问答、能力测评、形势分析等功能,正在探索通过标注数据库表、视图和字段的业务含义,实现文本与数据的关联查询。
  • 视频图片:模型能够识别视频中的内容,进行分类和行为识别,如检测挖土行为。
  • 遥感影像:提供影像智能解译、数据修复功能,针对长光、高分等数据源,采用光学、雷达、SAR等成像方式,处理三通道、多光谱、高光谱数据,提高解译精度。
  • 矢量几何:修复矢量数据的几何错误、拓扑错误,提升数据质量。
  • 场景模型构建:根据用户需求,自动化构建特定场景模型,如小麦面积计算模型,提供透明的推理过程。

应用领域

  • 影像数据处理:自动选择最合适的影像组合,进行几何校正、镶嵌和匀光匀色处理。
  • 变化检测:应用于国土变更调查、卫片执法、耕地保护等。
  • 各类调查:支持林草资源、水资源、自然资源资产等调查工作。
  • 气象预报:提供短临降水和气温预报,改进数值预报准确性。
  • 农业金融保险:为作物种植面积、灾害监测提供数据支持。
  • 税务管理:监测土地使用情况,辅助税务合规性检查。
  • 企业/政府数据融合:提供基于大模型的数据服务系统,支持数据融合、分析和共享。

数慧时空与青云科技的合作,旨在推动AI技术在各领域的广泛应用,共同开启AI发展的新篇章。

本文来源: 图灵汇 文章作者: 骆霞