华为全联接大会:昇腾芯片路线图公布,灵衢2.0技术规范开放

图灵汇官网

9月18日,华为在上海世博展览馆举办了全联接大会。会上,华为轮值董事长徐直军做了主题发言,题目是《以开创的超节点互联技术引领AI基础设施新方式》。他在讲话中首次公布了昇腾芯片的发展计划,并介绍了针对超节点设计的互联协议“灵衢”架构,同时开放了灵衢2.0的技术标准。

徐直军提到,从2019年昇腾910芯片发布以来,业界对昇腾系列芯片的关注持续增加。到2025年,基于昇腾910C芯片构建的Atlas900超节点将开始大规模应用。这次,华为正式发布了昇腾芯片的演进路线。

根据徐直军的说法,未来三年内,华为已经规划并开发了三个系列的昇腾芯片。其中包括昇腾950系列,预计在2026年第一季度推出昇腾950PR,第四季度推出昇腾950DT。另外,昇腾960计划在2027年第四季度推出,昇腾970则安排在2028年第四季度。

昇腾芯片为客户提供强大的计算能力。从大型能源算力基础设施的角度看,超节点已经成为主流产品形态,并逐渐成为AI建设的重要方向。

随着计算需求的增长,超节点的规模也在不断扩大。今年3月,华为推出了Atlas900超节点,目前已部署超过300套,服务20多个客户,覆盖互联网、电信和制造等多个领域。目前,它仍是全球最大的超节点。

基于未来发展的昇腾芯片,华为还计划推出Atlas 950和Atlas 960超节点。它们分别能部署8192张和15488张算力卡,提供的算力分别为8EFLOPS和30EFLOPS,远超英伟达的相关产品。

大规模超节点提升了计算和通用计算的能力,但也带来了新的技术难题。如何实现长距离、高可靠连接,以及大带宽、低时延,成为关键问题。

为了解决这些问题,华为在互联协议的每一层都加入了高可靠性机制。此外,光路上引入了纳秒级的故障检测与保护功能。当发生光模块闪断或故障时,系统能够及时感知并调整。通过重新设计光器件、光模块和互联芯片,大幅提升了光互联的稳定性,达到百倍提升,满足了高带宽和低时延的需求。

为了支持大规模超节点的运行,华为研发了超节点互联协议架构——灵衢。

徐直军表示,一个超节点可以像一台计算机一样进行工作、学习和推理。他认为,万卡级别的超节点应具备六大特点:总线级互联、平等协同、全量池化和协议统一等。

他还宣布,华为将开放灵衢架构2.0的技术规范。

本文来源: 图灵汇 文章作者: 贾姝旻