人工智能动态

微信公众号

人工智能报

微信视频号

图灵汇

抖音号

图灵汇

小红书

AI中国

头条号

媒体矩阵

更多

以上自媒体由本平台或本平台合作伙伴提供服务。

    9月 11
  1. 今天
  2. 星期四
00:00
grade

2月24日,DeepSeek启动了“开源周”活动,并公开了首个代码库FlashMLA。这个代码库针对Hopper GPU进行了专门优化,专注于提升MLA解码效率,尤其适合处理长度变化的序列任务。目前,这一内核已正式应用。

DeepSeek提到,在H800上,FlashMLA实现了高达3000GB/s的内存带宽以及580TFLOPS的计算能力。

扫描二维码即可下载图灵汇App
  • 扫码关注
  • 图灵汇