差一个ubuntu的文件

CUDA


  1. 卸载 CUDA

    # 卸载 runfile 方式安装的 CUDA
    sudo /usr/local/cuda-X.Y/bin/uninstall_cuda_X.Y.pl
    
    # 卸载 Deb 方式安装的 CUDA
    sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*"
    sudo apt-get autoremove
    
  2. 查看显卡驱动

    nvidia-smi
    

    这里的cuda Version并不是指已经安装了cuda,而是指该驱动最高能支持的cuda版本

  3. 搜索 CUDA 10.2 进入官网,下载 10.2 版本的CUDA

    CUDA Toolkit Archive

    这里推荐下载 10.2 版本的,或者其他兼容 pytorch 的 CUDA 版本即可

    Ubuntu18.04 用以下命令

    # 按序执行下列命令行
    wget <https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin>
    # 下载 pin 码,若终端无法链接则直接复制上述链接进入网页进行下载即可,已下载好的复制即可
    
    sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
    # 移动 cuda 的 pin 码
    
    wget <https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb>
    # 下载 deb 格式的本地安装包,若终端无法链接则直接复制上述链接进入网页进行下载即可
    
    sudo dpkg -i cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
    # 安装
    
    sudo apt-key add /var/cuda-repo-10-2-local-10.2.89-440.33.01/7fa2af80.pub
    # 添加钥匙
    
    sudo apt-get update
    

    Ubuntu20.04 用以下命令

    # 按序执行下列命令行
    wget <https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin>
    # 下载 pin 码,若终端无法链接则直接复制上述链接进入网页进行下载即可,已下载好的复制即可
    
    sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
    # 移动 cuda 的 pin 码
    
    wget <https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda-repo-ubuntu2004-11-3-local_11.3.1-465.19.01-1_amd64.deb>
    # 下载 deb 格式的本地安装包,若终端无法链接则直接复制上述链接进入网页进行下载即可
    
    sudo dpkg -i cuda-repo-ubuntu2004-11-3-local_11.3.1-465.19.01-1_amd64.deb
    # 安装
    
    sudo apt-key add /var/cuda-repo-ubuntu2004-11-3-local/7fa2af80.pub
    # 添加钥匙
    
    sudo apt-get update
    

    Ubuntu22.04 用以下命令

    # 按序执行下列命令行
    wget <https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin>
    # 下载 pin 码,若终端无法链接则直接复制上述链接进入网页进行下载即可,已下载好的复制即可
    
    sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
    # 移动 cuda 的 pin 码
    
    wget <https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda-repo-ubuntu2204-11-7-local_11.7.0-515.43.04-1_amd64.deb>
    # 下载 deb 格式的本地安装包,若终端无法链接则直接复制上述链接进入网页进行下载即可
    
    sudo dpkg -i cuda-repo-ubuntu2204-11-7-local_11.7.0-515.43.04-1_amd64.deb
    # 安装
    
    sudo cp /var/cuda-repo-ubuntu2204-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
    # 添加钥匙
    # sudo cp /var/cuda-repo-ubuntu2204-11-7-local/cuda-46B62B5F-keyring.gpg /usr/share/keyrings/c
    
    sudo apt-get update
    

    不要执行官网的最后一条命令

    <aside> 💡 这里千万注意,不要执行官网的 sudo apt install cuda -y ,因为他会直接获取最新的版本进行安装,会覆盖你上面安装的内容,我们这里只需要安装相对应的版本即可

    </aside>

    NVIDIA官方给出的各后缀解释

    Untitled

    这张表的第一行也解释了为什么我们没有遵循官网指示的最后一步sudo apt install cuda,因为这种方式默认安装最新版本且包含驱动。为了更准确地安装特定版本的CUDA且不安装驱动,应该用更详细的名称来指示安装。

    另外也可以发现,虽然我进入的是CUDA Toolkit 10.2的安装界面,但选择联网安装deb(network)添加了CUDA库后,是可以安装10.1或10.0的。

    总之,在上表中确定了要安装的CUDA版本的代号后,执行安装命令即可:

    sudo apt install cuda-toolkit-10-2 -y # 只安装 CUDA 10.2
    # sudo apt install cuda-10-2  #安装CUDA 10.2。包含驱动,版本自动选择。
    
    # cuda 11.3.1同理
    sudo apt install cuda-toolkit-11-3 -y
    
    # cuda 11.7.0同理
    sudo apt install cuda-toolkit-11-7 -y
    

    配置环境变量:sudo gedit ~/.bashrc

    在文件最后添加以下几句,注意文件版本号

    export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
    export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
    export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
    
    export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib:$LD_LIBRARY_PATH
    

    更新环境变量:source ~/.bashrc

CUDA Toolkit Archive

CUDA Toolkit Archive

  1. 查看是否安装成功

    nvcc -V

  2. 验证安装成功:若出现失败字样,则可能显卡驱动没了

    $ git clone --depth=1 <https://github.com/NVIDIA/cuda-samples.git>
    $ cd cuda-samples/Samples/1_Utilities/deviceQuery
    $ sudo make
    $ ./deviceQuery 
    # 最后输出PASS就成功了
    ./deviceQuery Starting...
    
     CUDA Device Query (Runtime API) version (CUDART static linking)
    ....
    ....
    Result = PASS
    

Bugs:


参考资料:

Ubuntu20.04下深度学习环境配置(持续维护)_m0_37412775的博客-CSDN博客

简易记录:安装GPU驱动,CUDA和cuDNN