微信公众号
微信视频号
抖音号
小红书
头条号
更多
以上自媒体由本平台或本平台合作伙伴提供服务。
提示信息将显示在这里。
2月24日,DeepSeek启动了“开源周”活动,并公开了首个代码库FlashMLA。这个代码库针对Hopper GPU进行了专门优化,专注于提升MLA解码效率,尤其适合处理长度变化的序列任务。目前,这一内核已正式应用。
DeepSeek提到,在H800上,FlashMLA实现了高达3000GB/s的内存带宽以及580TFLOPS的计算能力。
微信里点"发现",扫一下
二维码便可将本文分享至朋友圈。