Jim Keller 曾在英特尔、AMD 和特斯拉等企业担任重要职务,是业内知名的芯片专家。他在最近的一次演讲中提到,公司计划利用 RISC-V 开源架构开发新的 AI 处理器。这款处理器将基于普通的 DRAM 和以太网构建,目标是让所有人都能轻松搭建和扩展 AI 系统,从而加快 AI 技术的普及。
目前,Tenstorrent 正在建设专门的工厂,生产高性能 AI 设备所需的组件。他们已经推出多种产品,包括可扩展的 Galaxy box 服务器,以及为降低噪音设计的水冷 quiet box。此外,还推出了 PCIe 卡,并开始提供 Eson TPU 作为 IP 授权。一些客户如 LG 已经将他们的 AI 处理器集成到电视芯片中。
Jim Keller 表示,自己更关注的是公司的使命,而不是短期盈利。他认为当前 AI 技术发展迅速,但很多产品价格高且技术封闭。他希望打造一种更便宜、更快、更开放的架构,让更多的开发者和企业可以参与进来。
为了实现这个目标,Tenstorrent 正在研发基于 RISC-V 的开源 CPU。这项工作源于一次意外事件,一名网友通过逆向工程公开了处理器的详细信息,这反而让团队看到了开放的重要性。因此,他们承诺提供完整的开源软件栈,从模型、编译器到底层指令集都完全公开。
Black Hole 是一款采用台积电 6 纳米工艺制造的芯片,包含 140 个张量处理器和 RISC-V 核心,支持 GDDR6 DRAM 和片上 SRAM。他们选择不使用 HBM,因为成本太高且结构复杂。这种设计使得芯片更小、更便宜,适合大规模部署。
目前,Tenstorrent 的训练系统由 2000 个 Black Hole 芯片组成,相当于超过一百万个 RISC-V 处理器协同运行。这种规模需要高度优化的协作机制。他们还设计了一个由九个 Galaxy box 组成的单元,所有连接都有冗余,即使出现故障也能保持正常运行。
建造芯片的成本很高,每个 Black Hole 芯片大约花费 8000 万美元。每次升级都需要额外投入数千万美元。为了解决这个问题,Tenstorrent 正在转向小芯片(chiplets)设计。这些模块化的组件可以灵活组合,形成完整的解决方案。同时,他们也在推动开放小芯片架构计划,确保不同芯片之间可以兼容,并提供必要的测试、加密等功能。
他们还准备推出一种空芯片,内置所有必要功能,客户可以将自己的 IP 集成进去,快速开发新产品。Jim Keller 表示,公司销售的内容包括 IP、芯片和系统,甚至提供云端服务,帮助初创公司运行应用。
他的最终目标是让电脑设计变得更加简单和有趣。通过小芯片技术、更好的 IP、优化的验证流程以及开源的 AI 方法,未来的设计将更加高效和容易实现。他希望凝聚更多人的力量,共同推动技术进步,创造无限可能。