首届CCF-百川-英博大模型基金评审结果公布

图灵汇官网

大模型时代下的产学研融合革新

随着人工智能的迅速发展,大模型的崛起正在重塑各行业的面貌。GPT等大型模型不仅整合了多种小型模型,还使得自然语言交互的普及成为可能,极大地促进了人类与AI的互动。然而,面对高门槛和重资产的特点,传统科研模式受到了挑战,特别是高校等学术机构在资源获取方面的局限性,限制了它们接触实际问题的机会,导致学术创新的重心逐渐转移到像DeepMind和OpenAI这样的新型研究机构,这些机构产出的影响力显著工作(例如AlphaGo和GPT系列)。

与此同时,传统的产学研合作模式面临着低效的问题,企业资助的高校研究往往难以转化为实际业务价值。这一现象归因于双方视角的差异和数据、算力共享的障碍,特别是隐私和合规性的限制。

创新产学研合作模式的实践

为应对上述挑战,CCF、百川智能与英博数科携手创立了一种名为“组队合作”的新模式,旨在通过高校和研究机构甄选优秀的课题组,提供由百川和英博研发团队支持的数据、算力和工程服务,以降低大模型研究门槛,推动我国自主研发大模型的创新与落地。

广受关注的基金计划

CCF-百川-英博大模型基金由中国计算机学会、百川智能和英博数科共同发起,旨在搭建一个连接海内外高校及科研机构的产学研合作与学术交流平台,构建中国大模型创新生态圈。该基金在2023年9月19日正式启动,截至10月16日,共收到98份申请,覆盖了国内顶尖高校(如清华大学、北京大学、中国科学院等)以及香港、新加坡等地的大学。

评审过程由学术专家与行业代表组成的专家组负责,评估项目在大模型不同阶段、不同领域的创新性、可行性及其团队的学术水平和科研能力。最终,15个来自清华大学、北京大学、上海交通大学、复旦大学、中国人民大学、新加坡国立大学、香港城市大学等高校的项目获得了资助,资助比例远高于顶级学术会议ICML 2023的接收率。

多领域多方向的研究项目

在2023年CNCC期间举行的CCF产学合作发展论坛上,15个获资助项目得以公布,涵盖了人工智能的多个领域和应用场景:

  1. 陈武辉:中山大学软件工程学院副教授,专注于大规模AI训练、推理与模型迭代演化的系统软件及区块链系统软件,致力于提高大模型的效率与安全性。
  2. 邓志杰:上海交通大学清源研究院助理教授,研究大语言模型的贝叶斯偏好学习,通过结合先验知识和观测数据优化模型性能。
  3. 董胤蓬:清华大学助理研究员,专注于人工智能安全,通过高效算法评估大模型在恶意攻击下的鲁棒性。
  4. 窦志成:中国人民大学信息检索专家,探索个性化、生成式、对话式信息检索技术的创新。
  5. 桂韬:复旦大学研究人员,研究大模型自主价值对齐的稳定泛化训练策略,以提升模型的道德和实用性。
  6. 韩先培:中国科学院软件研究所研究员,致力于提升大模型长窗口信息的利用能力,构建评估体系。
  7. 吉炜:新加坡国立大学博士后,利用预训练大模型实现游戏垂域的多模态生成。
  8. 刘康:中国科学院自动化研究所研究员,研究大模型的训练与价值对齐,拥有丰富的学术荣誉与实践经验。
  9. 联合申请人:曹鹏飞,中国科学院自动化研究所助理研究员,研究自然语言处理、知识图谱,发表多篇国际会议论文。
  10. 刘鹏飞:上海交通大学生成式人工智能研究组负责人,研究大模型的数学推理能力,提出提示工程概念。
  11. 王奕森:北京大学助理教授,专注于机器学习理论和算法,特别是在AI安全性方面有深入研究。
  12. 严睿:中国人民大学长聘副教授,探索开放对话领域的对话角色代理,丰富人机交互技术。
  13. 叶庆:华中科技大学管理学博士,研究医疗大数据、机器学习,致力于慢病管理的个性化健康管理。
  14. 张倬胜:上海交通大学长聘教轨助理教授,研究基于大语言模型的自主智能体,提升环境感知与推理能力。
  15. 赵翔宇:香港城市大学数据科学学院助理教授,开发多任务、多模态医学大模型,解决医疗决策支持问题。
  16. 赵鑫:中国人民大学教授,研究预训练模型能力的学习与预测,推动大模型能力的高效提升。

结语

此次基金计划的成功实施不仅体现了产学研合作的活力与潜力,也展示了大模型在推动技术创新、解决实际问题方面的巨大可能性。未来,我们期待看到更多这样的合作模式,促进学术与产业的深度融合,共同推动人工智能技术的持续发展与应用。

本文来源: 图灵汇 文章作者: 常曾媛