Nature刊文:“open”AI的实际作用非常有限

图灵汇官网

Meta 坚持开源,不过这一做法在行业内依然招致不少批评。开放源代码促进会负责人 Stefano Maffulli 曾公开表示,称 Llama 模型为“开放”是误导用户并对“开放”这一概念造成污染。在大多数人眼中,“开放”往往意味着透明、共享与合作,尤其在开源软件领域。然而,在人工智能(AI)领域,“开放”却引发了诸多模糊和争议。

实际上,AI 行业资源高度集中,“开放”的真实含义及其影响需要进一步探讨。本文将深入解析“开放”AI 的定义、本质特征及局限性,以及它对资源共享、技术创新和市场竞争产生的影响。

“开放”AI 的定义

权威科学期刊《自然》上的一篇文章详细探讨了“开放”AI 的定义、本质特征与局限性。研究者指出,尽管“开放”AI 这个术语被广泛采用,但其实际内涵并不清晰。当代 AI 系统的开发和应用高度依赖集中资源,即使标榜“开放”的 AI,其透明性、可复用性和扩展性仍受限于资源垄断。

“开放”AI 的定义与挑战

“开放”这一概念在 AI 领域常被误用和扩展。“开放”源自开源软件运动,具有透明、可复用和公平的特点。然而,直接将这些特点应用于现代 AI,特别是生成式 AI,面临以下难题:

  • 模型复杂性与黑箱性:现代 AI 系统由复杂的神经网络构成,仅公开模型权重和代码不足以全面揭示其运行原理。
  • 资源依赖性:这些模型的开发和训练需要大量资金和数据,这些资源大多掌握在少数大公司手中。
  • 技术应用的不平衡:虽然“开放”的模型可供使用,但它们可能被不当利用,而最初的开发者对此难以施加影响。

“开放”AI 的优劣势

文章作者还分析了“开放”AI 的三大核心优势,并客观指出了其潜力与不足之处。尽管“开放”AI 在资源共享、技术创新和数据利用方面具有显著优势,但它未能从根本上打破少数大公司主导行业的局面。

  • 透明性:透明性是“开放”AI 的重要特性之一。部分 AI 模型会公开训练数据、权重或文档,方便研究人员验证系统行为。但透明性无法完全解释系统的复杂行为。
  • 可复用性:第三方可以基于“开放”AI 的现有模型或数据进行二次开发。公开许可的数据和模型权重,加上常见的开源许可,为“开放”AI 对市场竞争的积极影响提供了依据。不过,市场准入仍是一种受限资源。
  • 扩展性:“开放”AI 的扩展性体现在用户能够基于基础模型进行微调,以适应特定领域或任务。这是公司支持“开放”AI 的关键属性。

资源与权力分配

尽管“开放”AI 富有潜力,但 AI 系统的开发和应用离不开高度集中的关键资源,如模型、数据、人力、算力和开发框架。这些资源不仅决定技术的可用性,也深刻影响市场竞争和权力分配。

具体来看,在“开放”AI 的讨论中,AI 模型是最显眼的部分。许多模型只提供接口,用户无法深入了解其内部机制或进行修改。即使是相对透明的模型,也依赖于企业独有的训练资源,其他开发者难以复制这些资源,从而无法公平竞争。

结论

总体而言,“开放”AI 在透明度和共享方面有一定价值,但无法单独解决 AI 领域权力集中和资源分配不公的问题。目前关于“开放”的讨论更多是大公司用来规避监管和抢占市场的手段。若想真正改善现状,需要更有力的措施介入,比如反垄断执法和数据隐私保护。否则,单纯追求开放性很难带来实质性的好处。

未来,各方应更加关注 AI 的实际影响,而不是仅限于“开放”与“封闭”之间的争论。唯有从政策和技术层面入手,才能构建更公平、更负责任的 AI 生态系统。

本文来源: 互联网 文章作者: 每日咖啡资讯