Skip to content

CUDA/cuDNN


基础认知

常规AI训练

  • ✅ 无需单独安装CUDA/cuDNN
  • ✅ 深度学习框架已内置匹配版本
  • ✅ 选择框架版本即自动配置

🔥 别踩雷!

1.nvidia-smi显示的是驱动支持的最高版本
2.实际CUDA版本可能低于驱动版本
3.必须通过特定命令查询真实版本

🔍 版本查询方法

1.查询CUDA版本

bash
nvcc -V  # ⚠️注意V大写

2.查询cuDNN版本

bash
# 查找头文件位置
whereis cudnn_version.h cudnn.h

# 查看版本信息
cat /path/to/cudnn_version.h

⚙️ 安装与配置

官方资源

CUDA安装
cuDNN部署

环境配置

bash
# 设置库路径
echo "export LD_LIBRARY_PATH=/usr/local/cuda/lib64:\$LD_LIBRARY_PATH" >> ~/.bashrc
source ~/.bashrc && ldconfig

💡 最佳实践建议

版本管理

  • conda 安装的CUDA优先级高于系统CUDA
  • 验证当前版本:which nvcc

方案选择

场景推荐方案
常规训练使用框架内置CUDA
模型开发原生安装方案

故障排查

  1. 检查LD_LIBRARY_PATH配置
  2. 验证库路径:ldconfig -p
  3. 对比框架要求的CUDA版本