NVIDIA GPUドライバのインストール

以下の環境にNVIDIA GPUドライバをインストールする手順です。

  • GPU: NVIDIA A100
  • OS: Ubuntu20.04
  • GPU Driver: 550.x (LTS)

1. NVIDIA GPUドライバのみのインストール

1.1. パッケージのダウンロード

  1. NVIDIAの公式ドライバダウンロードサイトにアクセスします。
    NVIDIA 公式ドライバーのダウンロード | NVIDIA

  2. ドライバーの手動検索欄に A100 と記入いただき、それぞれ次の項目を選択ください。

  • 製品カテゴリ:Data Center / Tesla
  • 製品シリーズ:A-Series
  • 製品: NVIDIA A100
  • OS:Linux 64-bit Ubuntu 20.04
  1. 必要なバージョンのドライバをダウンロードします。

  2. ダウンロードにはNVIDIAの規約への同意が必要ですので、同意の上ダウンロードしてください。


1.2. インストール

  1. ダウンロードした .deb ファイルを対象サーバーにコピーします。

  2. サーバー上で以下のコマンドを実行します。

sudo dpkg -i <ダウンロードしたファイル>.deb
sudo cp /var/nvidia-driver-local-repo-ubuntu2004-550.xx.xx/nvidia-driver-local-xxxxxx-keyring.gpg /usr/share/keyrings/  
## dpkgコマンド実行時に表示されるcpコマンドの部分をコピーして実行ください

sudo apt update
sudo apt install nvidia-driver-550
sudo reboot
  1. サーバーが再起動したら、 nvidia-smi コマンドを実行し、GPUのリストが取得出来れば、インストールは完了です。

  2. 意図しないサスペンドによりマシンもしくはGPUにアクセス出来なくなることなどのリスクを防ぐため、下記コマンドも実行ください。

sudo systemctl enable multi-user.target --force
sudo systemctl set-default multi-user.target
sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target
sudo reboot

2. CUDA Toolkitのインストール

CUDAが必要な場合は、下記のサイトで必要なバージョンを選択し、インストール手順に従ってインストールを行ってください。

CUDA Toolkit Archive