NVIDIA GPUドライバのインストール
下記の環境にGPUドライバをインストールする場合の手順となります
- GPU: NVIDIA A100
- OS: Ubuntu20.04
- GPU Driver: 550.x (LTS)
1. NVIDIA GPUドライバのみのインストール
1.1. パッケージのダウンロード
下記のダウンロードサイトにアクセスください。
NVIDIA 公式ドライバーのダウンロード | NVIDIA
ドライバーの手動検索に A100
と記入いただき、下記の項目を選択ください。Data Center / Tesla | A-Series | NVIDIA A100
OSはLinux 64-bit Ubuntu 20.04
を選択ください。
お客様自身でNVIDIAの規約等にご同意の上、必要なバージョンをダウンロードください。
1.2. インストール
拡張子.debのファイルがダウンロードできますので、対象サーバにコピーしてください。
配置後サーバ上で下記コマンドを実行してください。
sudo dpkg -i <ダウンロードしたファイル>.deb
sudo cp /var/nvidia-driver-local-repo-ubuntu2004-550.xx.xx/nvidia-driver-local-xxxxxx-keyring.gpg /usr/share/keyrings/
## dpkgコマンド実行時に表示されるcpコマンドの部分をコピーして実行ください
sudo apt update
sudo apt install nvidia-driver-550
sudo reboot
再起動後 nvidia-smi
コマンドを実行し、GPUのリストが取得出来れば、インストールは成功となります。
インストール後、意図しないサスペンドによりマシンもしくはGPUにアクセス出来なくなることを防止するため、下記コマンドも実行ください。
sudo systemctl enable multi-user.target --force
sudo systemctl set-default multi-user.target
sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target
sudo reboot
2. CUDA Toolkitのインストール
CUDAが必要な場合には、下記のサイトで必要なバージョンを選択後、説明に従ってインストールを行ってください。