腾讯云发布专有云智算套件,助力企业打造专有智算云

图灵汇官网

腾讯云发布专有云智算套件,赋能企业私有算力环境

在近期举办的A2M人工智能创新峰会上,腾讯云副总裁李力宣布推出专为公有云设计的成熟实践转化而成的专有云智算套件。此套件整合了一系列关键能力,包括高性能计算集群构建模块、智能高性能网络IHN、高并发文件存储系统TurboFS、算力加速框架Taco以及GPU算力共享技术等核心组件,旨在帮助企业基于自有硬件搭建高性能的专有智算云。

强化算力利用与集群优化

腾讯云智算套件提供了一体化的云原生能力,帮助企业高效地利用算力卡资源,解决算力集群中的“木桶短板”效应。例如,腾讯云自主研发的高性能智能网络IHN,实现了算力卡之间持续稳定的高带宽通信;高性能文件存储系统则有效解决了海量数据存储的读写性能瓶颈问题。

精准调度与算力加速

智算套件在调度架构层融合了算力加速框架Taco和GPU算力共享技术qGPU。Taco通过优化网络协议、通信策略、AI框架和模型编译等多层级技术,显著提升了大模型训练和推理业务的性能。qGPU技术则在算力集群内部精准分配算力卡,从而提高了卡的使用效率。

强大的云平台与灵活性

腾讯云TCE(腾讯云专有云平台)具有与公有云相同的技术架构和“一云多芯”的能力,能够灵活支持不同规模的云平台构建,并能有效屏蔽底层硬件差异,更好地管理和整合不同类型的硬件设施。

成熟实践与大模型支持

腾讯云智算套件源自其在公有云算力集群HCC(高性能计算集群)的成熟实践。HCC集群结合了腾讯云自研服务器、高性能智能网络以及高并发文件存储系统,为大模型训练、自动驾驶、科学计算等领域提供了高性能、高带宽和低延迟的集群算力。

AI原生云的兴起与腾讯云的贡献

随着AI逐渐成为推动行业变革的关键力量,云计算与AI的深度融合催生了AI原生云这一新兴技术形态。腾讯云联合Gartner发布的《AI原生云建设与加速指南》强调,AI原生云旨在将AI技术深度融入云服务的各个层面,并着重构建开放性生态系统,通过丰富API和SDK支持AI原生服务和应用的开发。

基础设施与工程平台的创新

腾讯云围绕AI原生云构建新一代云平台架构,为客户提供AI原生理念的基础设施、模型、工程、应用、全栈安全防护等五大核心能力。在基础设施层,腾讯云构建了统一的算力平台,支持多GPU卡型,通过长稳训练、利用率提升以及任务和节点的异常恢复机制,助力模型训练效率提升200%,硬件资源利用率高达99%以上。

模型与安全的突破

在模型层,腾讯自研的大模型“混元”参数量级已达到万亿级别,采用了混合专家模型(MoE)结构,在中文能力上已接近GPT-4,特别是在时效性问题的回答、数学推理能力等方面表现出显著提升。此外,腾讯会议等SaaS产品已全面接入腾讯混元大模型。

在安全领域,腾讯全栈安全产品已集成AI技术,并在实际攻防场景中强化安全防线。腾讯云还在探索生成式AI在安全场景的应用。

分布式云部署与合作伙伴

腾讯云支持通过分布式云方式部署,为用户在多云、混合云场景下提供一致的产品服务和体验,通过集中管控统一管理云资源和业务应用,使用户能在任意位置获取所需的AI原生云资源与云服务。目前,包括百川智能、MiniMax、智谱科技、元象在内的大部分头部大模型企业已采用腾讯云解决方案。

结语

腾讯云专有云智算套件与AI原生云战略的推出,不仅为企业提供了高效、灵活的算力解决方案,也展示了腾讯在AI技术与云计算融合方面的创新实力。随着更多头部大模型企业的加入,腾讯云正不断深化与合作伙伴的合作,共同推动AI技术的发展与应用。

本文来源: 图灵汇 文章作者: 和顺仙