NVIDIA GPUドライバのインストール
以下の環境にNVIDIA GPUドライバをインストールする手順です。
- GPU: NVIDIA A100
- OS: Ubuntu20.04
- GPU Driver: 550.x (LTS)
1. NVIDIA GPUドライバのみのインストール
1.1. パッケージのダウンロード
NVIDIAの公式ドライバダウンロードサイトにアクセスします。
NVIDIA 公式ドライバーのダウンロード | NVIDIAドライバーの手動検索欄に
A100
と記入いただき、それぞれ次の項目を選択ください。
- 製品カテゴリ:Data Center / Tesla
- 製品シリーズ:A-Series
- 製品: NVIDIA A100
- OS:Linux 64-bit Ubuntu 20.04
必要なバージョンのドライバをダウンロードします。
ダウンロードにはNVIDIAの規約への同意が必要ですので、同意の上ダウンロードしてください。
1.2. インストール
ダウンロードした .deb ファイルを対象サーバーにコピーします。
サーバー上で以下のコマンドを実行します。
sudo dpkg -i <ダウンロードしたファイル>.deb
sudo cp /var/nvidia-driver-local-repo-ubuntu2004-550.xx.xx/nvidia-driver-local-xxxxxx-keyring.gpg /usr/share/keyrings/
## dpkgコマンド実行時に表示されるcpコマンドの部分をコピーして実行ください
sudo apt update
sudo apt install nvidia-driver-550
sudo reboot
サーバーが再起動したら、
nvidia-smi
コマンドを実行し、GPUのリストが取得出来れば、インストールは完了です。意図しないサスペンドによりマシンもしくはGPUにアクセス出来なくなることなどのリスクを防ぐため、下記コマンドも実行ください。
sudo systemctl enable multi-user.target --force
sudo systemctl set-default multi-user.target
sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target
sudo reboot
2. CUDA Toolkitのインストール
CUDAが必要な場合は、下記のサイトで必要なバージョンを選択し、インストール手順に従ってインストールを行ってください。