DeepSeek宣布开源MLA解码核FlashMLA,GitHubstar超1700
发布日期:2025-03-05 12:10 点击次数:96
新浪科技讯 2月24日上午消息,在上周DeepSeek宣布本周将是开源周(OpenSourceWeek),并将连续开源五个软件库后。今日,DeepSeek宣布开源了开源周首款用于Hopper GPU的高效型MLA解码核——FlashMLA。

新浪科技注意到,在GitHub上,目前该项目已经收获了超过1700star,并且拥有62个Fork。
MLA是DeepSeek V2-V3系列大模型最为重要技术创新,主要用于减少推理过程的KV Cache,进而降低推理成本。据DeepSeek介绍,FlashMLA是Hopper GPUs的有效MLA解码内核,可针对可变长度序列进行优化,目前主要发布包括:1、 BF16;2、块大小为64 的分页kvcache。
在基准测试性能表现上,FlashMLA在英伟达H800 SXM5 GPU上可实现3000 GB/s 的内存速度以及580TFLOPS的计算上限。(文猛)
责任编辑:郝欣煜
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

![[小炮APP]竞彩情报:芬兰队史射手王退出国家队](/images/defaultpic.gif)