1月16日,UALink联盟更新了最新版的董事会名单,阿里云正式成为其成员之一。阿里云将与AMD、AWS、微软、谷歌、苹果等企业联手,共同研发下一代GPU互联技术和相关标准。UALink 1.0版本预计将在2025年第一季度推出,该标准允许单个计算单元(Pod)内最多连接1024个GPU,每条通道的数据传输速度可达200Gbps。
近年来,随着人工智能模型不断进步以及应用场景的迅速扩展,多GPU协同工作变得愈发重要,这已成为AI基础设施升级的核心方向。为了寻求更高性能且更为开放的AI芯片级互联方案,UALink联盟于2024年10月创立,如今已成长为全球范围内专注于AI纵向扩展(Scale Up)的重要国际平台之一。UALink与目前由英伟达主导的NVLink技术有所不同,后者主要由单一厂商推动,而UALink则由产业链上的多家企业联合开发,目标是建立一个通用的开放互联标准,推动兼容性强的AI硬件生态体系形成,为更大规模、更复杂的人工智能任务提供更高效的运行环境。
UALink联盟最初的董事会成员涵盖了AMD、Astera Labs、AWS、思科、谷歌、惠普企业(HPE)、英特尔、Meta以及微软等知名企业。最近,阿里云、苹果和新思科技三家机构也相继加入联盟。联盟主席鲍曼提到,阿里云凭借其深厚的技术积淀,能够帮助UALink更好地明确符合实际业务需求的Scale Up互联规范,同时他也期待新成员能在推动UALink协议演进及构建行业生态圈方面贡献力量。
阿里云负责超高速互联的技术专家孔阳介绍道,作为全球顶尖的云服务供应商,阿里云一直坚持采用开放式协作模式来促进AI服务器Scale Up互联技术的进步,以满足不断攀升的AI算力需求和多样化业务场景带来的挑战。“我们自主研发的磐久AI Infra2.0服务器,在硬件架构上具有高度开放性,能够兼容主流AI解决方案,实现了‘一云多芯’的创新理念。”