EXO Labs 最近公布了一项新技术,解决了一个被网友讨论已久的问题:在选择 AI 小型主机时,是选苹果 Mac Studio 还是英伟达 DGX Spark?
测试中,EXO Labs 使用了两台 DGX Spark 和一台搭载 M3 Ultra 芯片的 Mac Studio。在运行大语言模型时,整体性能比单独使用 Mac Studio 提高了 2.8 倍。
这项技术基于 EXO 开源项目,目标是让大型语言模型可以在多种设备上协同运行。不同于以往只依赖单一 GPU 的方式,EXO 可以将任务分配到不同设备上,比如台式机、笔记本、服务器甚至手机,形成类似网络的 AI 系统。
DGX Spark 价格为 3999 美元,主要优势在于计算能力。Mac Studio 价格为 5599 美元,数据传输速度更快。EXO 把这两台设备组合在一起,形成统一的 AI 集群。
测试显示,DGX Spark 在加载数据时速度快 3.8 倍,而 Mac Studio 在生成内容时快 3.4 倍。两者结合后实现了互补效果。
大语言模型的推理分为两个阶段:预填充和解码。前者需要大量计算,后者则更依赖内存速度。EXO 把这两个阶段分别交给不同设备处理。DGX Spark 负责预填充,Mac Studio 负责解码。系统通过传递中间数据,让两台设备同时工作。
在 Meta Llama-3.1 8B 模型测试中,这种组合方式使性能提升了 2.8 倍。
EXO 展示了一种新的 AI 扩展思路,未来可能不再依靠单一强大硬件,而是通过智能调度多个设备提升整体性能。NVIDIA 的 Rubin CPX 平台也采用了类似方法。
目前 EXO 1.0 版本仍处于实验阶段,尚未全面公开。现有版本发布于 2025 年 3 月,后续会加入更多功能。
EXO 目前更适合研究用途,普通用户还不能直接使用。但它的表现说明,合理调度不同硬件资源可以显著提高 AI 效率,不需要依赖大型数据中心。