45 秒 AI 转录 34 分钟 4K 视频:苹果 Speech 技术力压群雄,比 OpenAI Whisper 快 55%

图灵汇官网

苹果最新推出的语音处理技术在实际测试中展现出惊人的效率。一项针对其全新 Speech 框架的实验显示,该系统能在短短 45 秒内完成对一段长达 34 分钟、体积达 7GB 的 4K 视频内容进行转录,相较其他主流工具表现出显著优势。

这项测试由一家科技媒体主导,使用的是基于苹果 Speech 框架开发的应用程序 Yap。测试过程中,视频内容被完整转写为 SRT 和 TXT 格式文件,整个过程仅耗时 45 秒。相比之下,使用 OpenAI Whisper 开源模型的 MacWhisper 工具则需要 1 分 41 秒才能完成相同任务。其他类似工具如 VidCap 和旧版本的 MacWhisper 更是分别耗时 1 分 55 秒和 3 分 55 秒。

值得注意的是,尽管所有工具在识别特定名称或术语时都存在一定的误差,但苹果的技术在本地化运行方面表现突出,尤其适合需要频繁处理大量音频或视频内容的用户。如果按周计算,这种速度上的提升将带来可观的时间节省。

测试结果显示,苹果 Speech 技术不仅在处理速度上领先,同时还能保持较高的准确率。对于依赖语音转录工作的创作者、研究人员以及内容生产者来说,这一进步无疑是一个重要突破。

45 秒 AI 转录 34 分钟 4K 视频:苹果 Speech 技术力压群雄,比 OpenAI Whisper 快 55%

45 秒 AI 转录 34 分钟 4K 视频:苹果 Speech 技术力压群雄,比 OpenAI Whisper 快 55%

45 秒 AI 转录 34 分钟 4K 视频:苹果 Speech 技术力压群雄,比 OpenAI Whisper 快 55%

本文来源: 图灵汇 文章作者: 策测解金