人工智能动态

微信公众号

人工智能报

微信视频号

图灵汇

抖音号

图灵汇

小红书

AI中国

头条号

媒体矩阵

更多

以上自媒体由本平台或本平台合作伙伴提供服务。

    7月 20
  1. 今天
  2. 星期日
37:00
grade

2月18日,DeepSeek在海外社交平台X上发布了一篇技术报告。这份报告详细说明了NSA(Natively Sparse Attention),一种针对长文本快速处理专门设计的稀疏注意力机制。这种机制经过优化,能在现有硬件上高效运行,不仅提升了推理速度,还降低了成本,同时保证了较好的性能表现。

有注意到,这篇名为《原生稀疏注意力:与硬件兼容且可原生训练的稀疏注意力机制》的论文中,DeepSeek创始人梁文锋也被列为共同作者之一。

扫描二维码即可下载图灵汇App
  • 扫码关注
  • 图灵汇