T
traeai
Sign in

产品

NVIDIA A100-SXM4-80GB

别名:nvidia a100

NVIDIA 推出的高性能 GPU,适用于深度学习和高性能计算。

已跟踪 2 条高相关材料

TraeAI 观察

相关材料

已收录 2 条与 NVIDIA A100-SXM4-80GB 相关的内容,按评分排序。

Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler

Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler

Hugging Face Blog5278 字 (约 22 分钟)
87

This beginner-friendly guide walks through using torch.profiler to analyze a matrix multiplication + addition operation, revealing CPU-GPU coordination patterns and how torch.compile fuses operations to reduce kernel launch overhead.

入选理由:使用 `torch.profiler.profile` + `record_function` 可轻松捕获 CPU/GPU 事件与内核调用链,生成可交互 trace 文件

FeaturedArticle#PyTorch#profiler#performance#CUDA#torch.compile英文
Hugging Face Blog 图标

Profiling in PyTorch (Part 2): From nn.Linear to a Fused MLP

Hugging Face Blog3813 字 (约 16 分钟)
85

PyTorch 中 nn.Linear 的性能分析显示,其内部的矩阵转置操作显著影响计算效率,通过融合 MLP 可以减少开销。

入选理由:nn.Linear 的矩阵转置操作会增加计算开销。

FeaturedArticle#PyTorch#性能优化#深度学习#GPU英文

跨材料问答 · NVIDIA A100-SXM4-80GB

回答基于:NVIDIA A100-SXM4-80GB 相关 2 条材料
    0 / 500

    AI may generate inaccurate information. Please verify important content.