OpenAI发布o1模型:错误率减少34%,速度提升50%,月付200美元Pro会员无限制调用 | 最前线

图灵汇官网

近日,知名研究机构OpenAI推出了一款全新升级的模型——o1。这款模型在多个性能指标上都有显著进步,错误率比之前的o1-preview版本减少了34%,运行速度提升了50%。

从12月6日开始,o1正式接替了o1-preview的地位,成为ChatGPT Plus和Pro订阅用户的默认选择。今年9月,OpenAI首次推出了面向科学、编程及数学领域的专业版o1大模型。不过,当时的o1-preview和o1 mini版本并未充分发挥出该模型的所有潜力。

经过这次更新,o1在智能水平、跨模态数据处理能力和反应效率等方面都得到了加强。据OpenAI联合创始人兼CEO山姆·阿尔特曼介绍,o1不仅大幅降低了错误率,还在回答问题的速度上实现了大幅提升。

阿尔特曼提到,o1的一大亮点是它会在给出答案前反复推敲,因此能提供更加全面和精确的结果。特别是在数学领域,o1的表现尤为亮眼。比如,在AIME 2024数学竞赛以及高级科学问题中,它的正确率分别达到了78.3%和75.6%,较o1-preview分别提升了28.3个百分点和1.5个百分点。

在速度表现上,o1也取得了突破。离线实验显示,它完成同样任务的时间比o1-preview缩短了约60%。例如,当被问到有关公元2世纪罗马帝王的问题时,o1仅需14秒就能给出答案,而o1-preview则需要33秒。

针对之前用户反馈的简单问题处理耗时较长的情况,开发团队已经对此进行了调整。如今,无论是应对简单还是复杂的问题,o1都能以更快的速度响应。

此外,o1新增了一项重要功能——多模态输入支持,这意味着它可以同时分析图片和文字,并据此做出判断。现场展示中,一张包含太阳和制冷装置的手绘草图被提交给o1,无需额外指导,o1即刻生成相关问题并准确解答。整个过程耗时不到10秒。

为了让用户享受无上限使用模型的服务体验,OpenAI同步上线了ChatGPT Pro会员计划。只要每月缴纳200美元,用户就可以无限次访问更先进的o1 Pro版本。多项测试表明,o1 Pro在数学比赛、编程挑战以及尖端科研题目中的准确率分别达到了80.0%、74.9%和74.2%,优于其他版本。

不仅如此,OpenAI还分享了o1 Pro在复杂问题解决方面的实例。在一次化学难题测试中,o1 Pro仅用53秒就完成了作答,并且允许使用者回顾其解题思路。接下来,OpenAI打算扩展o1 Pro的应用范围,让它能够胜任更高强度的任务,比如处理更长篇幅或更复杂的作业。同时,o1 Pro还将引入网页浏览、文档上传以及更强大的API接口支持,涵盖结构化输出、函数调用以及图像解析等功能。

本文来源: 互联网 文章作者: 科技金属肖