别等Sora了！这些国产AI视频大模型，款款都超能打

投稿
APP
微信扫一扫获取更多

别等Sora了！这些国产AI视频大模型，款款都超能打

江城雪

2024-12-11 13:01:03

图灵汇官网

引言

Sora 已经来了，不过不是完全开放的状态。在一场为期12天的发布会活动的第三天，OpenAI 向公众正式推出了 AI 视频大模型 Sora Turbo，支持生成最长20秒的视频，仅为最初宣传时长的三分之一。更重要的是，目前只有部分用户能体验到 Sora Turbo，因为这款应用仍处于测试阶段。

在 Sora 之前，海外已有其他公司开发出类似的视频大模型。然而直到今年2月 Sora 的首次亮相，视频大模型行业才迎来快速发展的时期。尽管 Sora 推动了这一领域的发展，但它的进度似乎已经落后。

国内市场也不甘示弱，已经有超过20款 AI 视频大模型出现。像腾讯、阿里巴巴和字节跳动这样的互联网巨头也推出了自己的视频大模型。从行业的角度看，这些模型让机器能够理解和重构真实世界；而从用户的角度来看，它们极大地激发了人们的创造力。

与通用语言模型不同，视频大模型的应用场景更为专业，现阶段大部分都需要付费使用。免费用户通常只能获得少量积分或每天有限次数的视频生成机会，且可能无法享受高级功能。因此，很多人可能不清楚国内有哪些视频大模型。

接下来，我们将介绍六款国内知名的 AI 大模型，并分析它们的功能特点。也许未来，这些模型会成为你实现创意的得力工具。

国产视频大模型的竞争

Sora 发布后，快手科技的 AI 团队迅速推出了可灵，现在已经升级到1.5版本。小雷认为，可灵是国内众多视频大模型中体验较好的几款之一。它提供两种模式：文字生成视频和图片生成视频，并允许用户调整创意水平和相关性。免费用户可以用文字生成最长5秒的高清视频，或者用图片生成最长10秒的标准视频。小雷用描述语生成了一段视频，细节很丰富，但生成结果是在白天，而不是描述中的夜晚。

即梦：解析能力强，但缺乏灵活性

快手推出可灵之后，抖音紧随其后，推出了即梦。除了文字生成视频和图片生成视频功能外，即梦还增加了对口型功能。即梦已经更新了好几个版本，但需要积分才能使用。小雷用同样的描述语生成了一段视频，质量不错，但猫咪的动作显得有些机械，缺乏灵活性。

混元：功能有待完善，潜力巨大

腾讯最近推出了混元视频大模型，目前只支持文字生成视频，每天免费生成次数有限。小雷生成的视频质量不高，细节不足。不过，作为互联网巨头腾讯的产品，混元有望通过未来的迭代升级，达到与其他优秀模型相当的水平。

Vidu：功能多样，镜头切换自然

Vidu 是由北京数生科技与清华大学联合开发的，支持文字生成视频和图片生成视频，并且可以生成具有立体感的画面。小雷生成的视频质量很高，细节丰富，镜头切换自然流畅。唯一的缺点是沙滩的效果不够真实。

清影：功能丰富，但理解能力有待提高

清影是由清华大学计算机系知识工程研究室团队开发的模型，功能丰富，支持文字生成视频和图片生成视频。小雷生成的视频质量较差，画面几乎看不出是视频。与 Vidu 相比，清影在理解自然语言方面还有提升的空间。

PixVerse：画面精美，但动作僵硬

PixVerse 是由爱诗科技开发的，功能丰富，支持多种设置和调整。小雷生成的视频画面精美，但猫咪的动作显得过于僵硬。尽管存在这些问题，PixVerse 的表现依然出色。

细节决定成败

国内 AI 企业在视频大模型领域已经迈出了重要一步，但仍需不断优化。小雷体验过的可灵、即梦、Vidu 和 PixVerse 表现最好，腾讯混元位居第二梯队，清影则处于第三梯队。虽然这些模型各有所长，但在细节上的改进仍是关键。AI 视频大模型需要更好地理解自然语言，提高画面细节和镜头切换的质量，才能真正成为用户的创作助手。此外，高昂的价格限制了付费用户的数量，许多 AI 视频大模型公司需要找到盈利途径，以应对激烈的市场竞争。