差一个ubuntu的文件
卸载 CUDA
# 卸载 runfile 方式安装的 CUDA
sudo /usr/local/cuda-X.Y/bin/uninstall_cuda_X.Y.pl
# 卸载 Deb 方式安装的 CUDA
sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*"
sudo apt-get autoremove
查看显卡驱动
nvidia-smi
这里的cuda Version并不是指已经安装了cuda,而是指该驱动最高能支持的cuda版本
搜索 CUDA 10.2 进入官网,下载 10.2 版本的CUDA
这里推荐下载 10.2 版本的,或者其他兼容 pytorch 的 CUDA 版本即可
Ubuntu18.04 用以下命令
# 按序执行下列命令行
wget <https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin>
# 下载 pin 码,若终端无法链接则直接复制上述链接进入网页进行下载即可,已下载好的复制即可
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
# 移动 cuda 的 pin 码
wget <https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb>
# 下载 deb 格式的本地安装包,若终端无法链接则直接复制上述链接进入网页进行下载即可
sudo dpkg -i cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
# 安装
sudo apt-key add /var/cuda-repo-10-2-local-10.2.89-440.33.01/7fa2af80.pub
# 添加钥匙
sudo apt-get update
Ubuntu20.04 用以下命令
# 按序执行下列命令行
wget <https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin>
# 下载 pin 码,若终端无法链接则直接复制上述链接进入网页进行下载即可,已下载好的复制即可
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
# 移动 cuda 的 pin 码
wget <https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda-repo-ubuntu2004-11-3-local_11.3.1-465.19.01-1_amd64.deb>
# 下载 deb 格式的本地安装包,若终端无法链接则直接复制上述链接进入网页进行下载即可
sudo dpkg -i cuda-repo-ubuntu2004-11-3-local_11.3.1-465.19.01-1_amd64.deb
# 安装
sudo apt-key add /var/cuda-repo-ubuntu2004-11-3-local/7fa2af80.pub
# 添加钥匙
sudo apt-get update
Ubuntu22.04 用以下命令
# 按序执行下列命令行
wget <https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin>
# 下载 pin 码,若终端无法链接则直接复制上述链接进入网页进行下载即可,已下载好的复制即可
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
# 移动 cuda 的 pin 码
wget <https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda-repo-ubuntu2204-11-7-local_11.7.0-515.43.04-1_amd64.deb>
# 下载 deb 格式的本地安装包,若终端无法链接则直接复制上述链接进入网页进行下载即可
sudo dpkg -i cuda-repo-ubuntu2204-11-7-local_11.7.0-515.43.04-1_amd64.deb
# 安装
sudo cp /var/cuda-repo-ubuntu2204-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
# 添加钥匙
# sudo cp /var/cuda-repo-ubuntu2204-11-7-local/cuda-46B62B5F-keyring.gpg /usr/share/keyrings/c
sudo apt-get update
不要执行官网的最后一条命令
<aside> 💡 这里千万注意,不要执行官网的 sudo apt install cuda -y ,因为他会直接获取最新的版本进行安装,会覆盖你上面安装的内容,我们这里只需要安装相对应的版本即可
</aside>
这张表的第一行也解释了为什么我们没有遵循官网指示的最后一步sudo apt install cuda,因为这种方式默认安装最新版本且包含驱动。为了更准确地安装特定版本的CUDA且不安装驱动,应该用更详细的名称来指示安装。
另外也可以发现,虽然我进入的是CUDA Toolkit 10.2的安装界面,但选择联网安装deb(network)添加了CUDA库后,是可以安装10.1或10.0的。
总之,在上表中确定了要安装的CUDA版本的代号后,执行安装命令即可:
sudo apt install cuda-toolkit-10-2 -y # 只安装 CUDA 10.2
# sudo apt install cuda-10-2 #安装CUDA 10.2。包含驱动,版本自动选择。
# cuda 11.3.1同理
sudo apt install cuda-toolkit-11-3 -y
# cuda 11.7.0同理
sudo apt install cuda-toolkit-11-7 -y
配置环境变量:sudo gedit ~/.bashrc
在文件最后添加以下几句,注意文件版本号
export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib:$LD_LIBRARY_PATH
更新环境变量:source ~/.bashrc
查看是否安装成功
nvcc -V
验证安装成功:若出现失败字样,则可能显卡驱动没了
$ git clone --depth=1 <https://github.com/NVIDIA/cuda-samples.git>
$ cd cuda-samples/Samples/1_Utilities/deviceQuery
$ sudo make
$ ./deviceQuery
# 最后输出PASS就成功了
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
....
....
Result = PASS