计算机视觉是人工智能系统中用来“看”的关键技术,目前在AI领域受到广泛关注。最近,国际计算机视觉大会(ICCV 2025)成功召开。期间,合合信息与上海交通大学等单位共同举办了首次关于视觉质量评估的研讨会。此外,还组织了一项文档图像质量评估比赛,吸引了来自世界各地多所高校和研究机构的众多参赛者。
这项比赛的目标是开发出能与人眼判断相匹配的质量评估模型。经过多轮评审,一支名为DeQA-Doc的团队提交的方案表现出色,他们将多模态大模型在图像质量评估方面的优势应用到了文档图像领域,最终成绩位列第一。
随着数字化进程加快,文档图像成为信息传递的重要形式。但通过手机或相机拍摄的文档图像常常会受到环境因素影响,出现模糊、变形等问题。智能处理技术可以改善这些问题,比如去除模糊、调整图像形状。然而,如何准确评估这些技术的效果仍是行业难题。传统方法与实际视觉体验不一致,主观评价效率低,难以满足大规模测试需求。这次比赛汇集了全球选手,他们提出了多种解决方案,帮助提升文档处理系统的性能。
AI行业的进步需要从实际应用中发现问题,并用新技术解决具体挑战。这也是合合信息与上海交通大学联合举办比赛的原因之一。合合信息专注于多模态文本智能技术,此前已经在图像处理方面与上海交通大学展开合作。双方采用“企业提出问题,高校进行研究”的模式,推动科研成果向实际应用转化。公司提供实际场景和计算资源,学校组织团队进行研究,合作过程中产生了多篇论文和多项专利,对文档图像处理技术的发展起到积极作用。
未来,合合信息与上海交通大学将继续加强合作,以实际需求为方向,以技术创新为动力,探索更多合作方式,推动人工智能和计算机视觉领域的技术发展和实际应用。
