别等Sora了!这些国产AI视频大模型,款款都超能打

图灵汇官网

引言

Sora 已经来了,不过不是完全开放的状态。在一场为期12天的发布会活动的第三天,OpenAI 向公众正式推出了 AI 视频大模型 Sora Turbo,支持生成最长20秒的视频,仅为最初宣传时长的三分之一。更重要的是,目前只有部分用户能体验到 Sora Turbo,因为这款应用仍处于测试阶段。

在 Sora 之前,海外已有其他公司开发出类似的视频大模型。然而直到今年2月 Sora 的首次亮相,视频大模型行业才迎来快速发展的时期。尽管 Sora 推动了这一领域的发展,但它的进度似乎已经落后。

国内市场也不甘示弱,已经有超过20款 AI 视频大模型出现。像腾讯、阿里巴巴和字节跳动这样的互联网巨头也推出了自己的视频大模型。从行业的角度看,这些模型让机器能够理解和重构真实世界;而从用户的角度来看,它们极大地激发了人们的创造力。

与通用语言模型不同,视频大模型的应用场景更为专业,现阶段大部分都需要付费使用。免费用户通常只能获得少量积分或每天有限次数的视频生成机会,且可能无法享受高级功能。因此,很多人可能不清楚国内有哪些视频大模型。

接下来,我们将介绍六款国内知名的 AI 大模型,并分析它们的功能特点。也许未来,这些模型会成为你实现创意的得力工具。

国产视频大模型的竞争

Sora 发布后,快手科技的 AI 团队迅速推出了可灵,现在已经升级到1.5版本。小雷认为,可灵是国内众多视频大模型中体验较好的几款之一。它提供两种模式:文字生成视频和图片生成视频,并允许用户调整创意水平和相关性。免费用户可以用文字生成最长5秒的高清视频,或者用图片生成最长10秒的标准视频。小雷用描述语生成了一段视频,细节很丰富,但生成结果是在白天,而不是描述中的夜晚。

即梦:解析能力强,但缺乏灵活性

快手推出可灵之后,抖音紧随其后,推出了即梦。除了文字生成视频和图片生成视频功能外,即梦还增加了对口型功能。即梦已经更新了好几个版本,但需要积分才能使用。小雷用同样的描述语生成了一段视频,质量不错,但猫咪的动作显得有些机械,缺乏灵活性。

混元:功能有待完善,潜力巨大

腾讯最近推出了混元视频大模型,目前只支持文字生成视频,每天免费生成次数有限。小雷生成的视频质量不高,细节不足。不过,作为互联网巨头腾讯的产品,混元有望通过未来的迭代升级,达到与其他优秀模型相当的水平。

Vidu:功能多样,镜头切换自然

Vidu 是由北京数生科技与清华大学联合开发的,支持文字生成视频和图片生成视频,并且可以生成具有立体感的画面。小雷生成的视频质量很高,细节丰富,镜头切换自然流畅。唯一的缺点是沙滩的效果不够真实。

清影:功能丰富,但理解能力有待提高

清影 是由清华大学计算机系知识工程研究室团队开发的模型,功能丰富,支持文字生成视频和图片生成视频。小雷生成的视频质量较差,画面几乎看不出是视频。与 Vidu 相比,清影在理解自然语言方面还有提升的空间。

PixVerse:画面精美,但动作僵硬

PixVerse 是由爱诗科技开发的,功能丰富,支持多种设置和调整。小雷生成的视频画面精美,但猫咪的动作显得过于僵硬。尽管存在这些问题,PixVerse 的表现依然出色。

细节决定成败

国内 AI 企业在视频大模型领域已经迈出了重要一步,但仍需不断优化。小雷体验过的可灵、即梦、Vidu 和 PixVerse 表现最好,腾讯混元位居第二梯队,清影则处于第三梯队。虽然这些模型各有所长,但在细节上的改进仍是关键。AI 视频大模型需要更好地理解自然语言,提高画面细节和镜头切换的质量,才能真正成为用户的创作助手。此外,高昂的价格限制了付费用户的数量,许多 AI 视频大模型公司需要找到盈利途径,以应对激烈的市场竞争。

本文来源: 互联网 文章作者: 江城雪
    下一篇

导读:导读THECAPITALAI大模型深度分析报告,展示AI在内容获取、创作、交互及行业场景的应用前景。本文4689字,约5.4分钟作者 | 融中咨询来源 | 融中咨询(ID:gh_fdc07527