NVIDIA GPUドライバのインストール

下記の環境にGPUドライバをインストールする場合の手順となります

  • GPU: NVIDIA A100
  • OS: Ubuntu20.04
  • GPU Driver: 550.x (LTS)

1. NVIDIA GPUドライバのみのインストール

1.1. パッケージのダウンロード

下記のダウンロードサイトにアクセスください。

NVIDIA 公式ドライバーのダウンロード | NVIDIA

ドライバーの手動検索に A100 と記入いただき、下記の項目を選択ください。
Data Center / Tesla | A-Series | NVIDIA A100

OSはLinux 64-bit Ubuntu 20.04を選択ください。

お客様自身でNVIDIAの規約等にご同意の上、必要なバージョンをダウンロードください。

1.2. インストール

拡張子.debのファイルがダウンロードできますので、対象サーバにコピーしてください。

配置後サーバ上で下記コマンドを実行してください。

sudo dpkg -i <ダウンロードしたファイル>.deb
sudo cp /var/nvidia-driver-local-repo-ubuntu2004-550.xx.xx/nvidia-driver-local-xxxxxx-keyring.gpg /usr/share/keyrings/  
## dpkgコマンド実行時に表示されるcpコマンドの部分をコピーして実行ください

sudo apt update
sudo apt install nvidia-driver-550
sudo reboot

再起動後 nvidia-smi コマンドを実行し、GPUのリストが取得出来れば、インストールは成功となります。

インストール後、意図しないサスペンドによりマシンもしくはGPUにアクセス出来なくなることを防止するため、下記コマンドも実行ください。

sudo systemctl enable multi-user.target --force
sudo systemctl set-default multi-user.target
sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target
sudo reboot

2. CUDA Toolkitのインストール

CUDAが必要な場合には、下記のサイトで必要なバージョンを選択後、説明に従ってインストールを行ってください。

CUDA Toolkit Archive