OpenAI 发布了最新的 AI 视频生成工具 Sora。这个系统允许用户通过简单的文字提示创造出高质量的视频内容。这一发布距离 Sora 的首次亮相已有一年时间。
Sora 将从当天晚上起面向美国和其他市场中 ChatGPT 的付费会员开放。新版本 Sora Turbo 提供最长20秒的视频生成,并支持多种风格供用户挑选。
自今年2月宣布 Sora 后,OpenAI 已经与多家影视公司、媒体高层以及经纪机构展开合作。同时,他们还邀请了一些艺术家、演员和导演参与体验。
OpenAI 强调,Sora 是一项重要的基础性 AI 技术,能有效理解和模仿真实环境。这项技术对开发与现实交互的模型非常关键。然而,Sora 在初步测试阶段也显示出一些不足之处,比如偶尔会出现人物动作异常的情况,对物理规律的理解还不够完善。而且,相比图像生成器或聊天机器人,Sora 制作每段视频所需的资源更多,耗时也更长。
OpenAI CEO 表示,目前 Sora 的使用仍有一定限制。ChatGPT Plus 用户每月可免费制作50段低清视频;而 ChatGPT Pro 用户则没有上限地制作高清视频(最高1080p,最长20秒),还可同时生成五段视频且无需添加标识。
Sora 最大的亮点在于其出色的物理世界模拟能力,OpenAI 称之为“新兴的仿真技术”。此前,尚无其他文字转视频模型能达到此高度。例如,Sora 能够在一个视频里设置多个视角,并精准呈现人物形象与画面风格。用户既能生成一分钟左右的完整视频,也能定制较短片段。Sora 支持横屏、竖屏及正方形等多种比例,计算强度越高,画质越清晰。
有人认为,周一发布的 Sora 很像 OpenAI 的图像创作工具 DALL-E。只要输入想要的画面描述,Sora 就能快速生成对应的高清片段。
Sora 的页面展示了几个实用功能,比如“Remix”(重混)。这项功能让用户可以修改视频中的元素,如替换、删除或重新设计特定部分。例如,用户可以构建一个通往图书馆的大门场景,接着换成法式双开门,再将图书馆转换成太空船,最后去掉飞船,加入森林,甚至用月球表面替代森林。
Sora 还配备了一个叫“Storyboard”的选项,帮助用户规划视频各阶段的情节发展,从而优化整体效果。此外,Sora 提供了一个浏览他人作品的功能。
Sora 的推出是 OpenAI 十二天产品展示计划的一部分。上周,OpenAI 推出了价格更高的 ChatGPT Pro 订阅方案,提供对顶级 AI 模型的无限访问权限。
在费用方面,Sora 现已整合进 OpenAI 的两种服务套餐中。ChatGPT Plus 每月20美元,生成的视频分辨率为720p,最长5秒;ChatGPT Pro 每月200美元,允许用户自由制作高分辨率视频(1080p,最长20秒),还能一次生成五个视频,且支持无水印下载。