/ 行情价格

DeepSeek发布DeepGEMM:高效FP8 GEMM库,优化V3/R1训练与推理

发布时间:2025-02-26 10:38:44
欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载  官网地址

2月26日,DeepSeek在开源周第三天推出DeepGEMM,一个支持FP8 GEMM的CUDA库,专为稠密矩阵计算和混合专家(MoE)架构优化。

DeepGEMM主要特性:

  • 高性能:Hopper GPU上实现超过1350 FP8 TFLOPS
  • 极简依赖:代码简洁,无繁重依赖
  • JIT即时编译:运行时自动优化,无需预编译
  • 核心代码仅约300行,性能超越大多数优化内核
  • 支持稠密布局及两种MoE布局

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com