产品

CUDA kernels

Q: CUDA kernels 最近有什么新动态？

traeai 已收录 1 篇与 CUDA kernels 相关的内容。最新一篇是「Great collab with @SakanaAILabs on an #ICML26 paper about sparse transformer kernels + formats optim...」，由 NVIDIA AI(@NVIDIAAI) 发布。

别名：Fused CUDA kernels

专为稀疏计算优化的GPU内核，支持高效并行执行。

已跟踪 1 条高相关材料

TraeAI 观察

如果只读 3 篇

Great collab with @SakanaAILabs on an #ICML26 paper about sparse transformer kernels + formats optim...

NVIDIA AI(@NVIDIAAI) · 8.7 分

NVIDIA与SakanaAILabs合作发表ICML2026论文，提出基于稀疏Transformer内核与格式优化的TwELL压缩技术，结合融合CUDA内核，在大规模模型上实现超过20%的推理与训练加速，显著提升能效与内存效率。

NVIDIA与SakanaAILabs合作发布ICML2026稀疏Transformer优化论文

NVIDIA AI(@NVIDIAAI)5月9日146 字 (约 1 分钟)

NVIDIA与SakanaAILabs合作发表ICML2026论文，提出TwELL稀疏打包与融合CUDA内核，实现20%+推理/训练加速。

入选理由：TwELL稀疏打包格式可实现99%以上神经元稀疏度，对下游性能影响小于1%

精选推文#Transformer#稀疏计算#NVIDIA GPU#LLM优化#ICML2026英文

跨材料问答 · CUDA kernels

回答基于：CUDA kernels 相关 1 条材料