苹果公司最新推出的语音处理技术在实际测试中展现出惊人的效率。一项针对其全新 Speech 框架的测试显示,该系统能够在短短 45 秒内完成一段长达 34 分钟、容量达 7GB 的 4K 视频转录任务。这项成果比目前市场上主流的 OpenAI Whisper 工具快出 55%。
测试过程中使用的是基于苹果 Speech 框架开发的应用程序 Yap。这款工具不仅速度快,还能输出标准的 SRT 和 TXT 格式文件,满足多种使用场景的需求。相比之下,MacWhisper(V3 Turbo)版本需要 1 分 41 秒,而 VidCap 则用了 1 分 55 秒,MacWhisper(V2)更是耗时 3 分 55 秒。
尽管所有测试工具在识别特定名称时都有一定误差,但 Yap 的本地化处理能力使其在速度上占据明显优势。对于需要频繁处理视频内容的用户来说,这种效率提升意味着每天节省大量时间,长期积累下来效果尤为显著。
苹果此次的技术突破不仅展示了其在人工智能领域的持续投入,也为开发者和内容创作者提供了更高效的选择。随着更多应用接入这一框架,未来可能会看到更多基于本地运算的创新产品出现。