模型训练
Project DIGITS
Project DIGITS 是 NVIDIA 推出的高性能 AI 计算设备,基于 Grace Blackwell 架构,配备 GB10 Superchip,提供高达 1 万万亿次的 AI 计算能力,支持运行 2000 亿参数的大模型。其具备 128GB 统一内存和 4TB NVMe 存储,支持本地开发与云端部署,适配多种 AI 应用场景,如研究、数据分析、教育及医疗等。
Profiling Data
Profiling Data是DeepSeek开发的开源性能分析工具,基于PyTorch Profiler收集程序运行数据,用于优化深度学习模型的训练和推理效率。它支持可视化分析,可定位性能瓶颈、分析资源利用情况、优化通信策略,并适用于分布式系统调优。通过提供详细的运行指标,帮助开发者提升计算与通信效率,实现更高效的系统性能。