• 你的位置:1688彩票官网app > 新闻动态 >

  • DeepSeek开源周第三日 发布高性能通用矩阵乘法库
    发布日期:2025-03-06 16:06    点击次数:167

    新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8(8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

    据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

    DeepSeek表示,DeepGEMM在HopperGPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。





Powered by 1688彩票官网app @2013-2022 RSS地图 HTML地图