热点:

    DeepSeek正式发布开源项目DeepGEMM

      [  中关村在线 原创  ]   作者:海是天的倒影

    DeepSeek正式发布开源项目DeepGEMM

    2月26日的报道显示,今天上午9点,DeepSeek如期履行了其“开源周”的承诺,正式发布了开源项目DeepGEMM。这一消息发布后迅速引起了广泛关注,累计阅读量达到2.1万次,充分体现了该项目在国内外技术领域的热度。

    据介绍,DeepGEMM是一款专注于FP8高效通用矩阵乘法(GEMM)的库,主要满足普通矩阵计算以及混合专家(MoE)分组场景下的计算需求。该库能够动态优化资源分配,从而显著提升算力效率。DeepGEMM基于CUDA开发,采用了轻量级即时编译(JIT)模块,支持运行时动态编译内核,无需提前完成编译和安装。

    值得注意的是,DeepGEMM的设计初衷是为DeepSeek-V3/R1模型的训练与推理提供简洁高效的底层支持。特别是针对Hopper架构GPU(例如H800)进行了深度优化,既保证了高性能,又兼顾了成本控制。

    作为“开源周”活动中的第三项成果,DeepGEMM的推出延续了DeepSeek一贯的开源策略,进一步降低了高性能计算技术的应用门槛。此前,DeepSeek已相继发布了FlashMLA(高效解码内核)和DeepEP(专家并行通信库),这些项目共同构成了其推动技术开放与合作的重要举措。

    此次“开源周”活动定于2月24日至28日举行,期间DeepSeek计划陆续发布多项开源项目,旨在通过共享技术成果促进行业创新与发展。

    本文属于原创文章,如若转载,请注明来源:DeepSeek正式发布开源项目DeepGEMMhttps://news.zol.com.cn/953/9535956.html

    news.zol.com.cn true https://news.zol.com.cn/953/9535956.html report 1006 2月26日的报道显示,今天上午9点,DeepSeek如期履行了其“开源周”的承诺,正式发布了开源项目DeepGEMM。这一消息发布后迅速引起了广泛关注,累计阅读量达到2.1万次,充分体现了该项目在国内外技术领域的热度。据介绍,DeepGEMM是一款专注于FP8高效通用矩阵乘法(GEMM)...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错