View a markdown version of this page

NVIDIA ドライバー - Amazon Linux 2023

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

NVIDIA ドライバー

Amazon Linux 2023 は、専用リポジトリを通じて NVIDIA GPU ドライバーと CUDA ツールキットパッケージを提供します。このリポジトリは によって管理 AWS され、Amazon Linux セキュリティセンター (ALAS) を通じてセキュリティアドバイザリを提供します。

NVIDIA リポジトリについて

AL2023 NVIDIA リポジトリは、AL2023 の公式 NVIDIA CUDA リポジトリからのパッケージをミラーリングします。 は、再配布前に AL2023 リリース候補で NVIDIA ソフトウェアを AWS 認定し、このリポジトリ内のパッケージのセキュリティアドバイザリを提供します。

リポジトリは、 GovCloud (米国) リージョンや AWS 中国リージョンなど AWS 、すべての AWS 商用リージョンで利用できます。

リポジトリは、x86_64 アーキテクチャ用の NVIDIA Tesla (データセンターコンピューティング) とグラフィックスドライバーを提供します。仮想ディスプレイおよびリモートワークステーション機能に使用される GRID ドライバーは含まれません。GRID ドライバーのインストールについては、EC2 ユーザーガイドの「NVIDIA ドライバーのインストール」を参照してください。

NVIDIA リポジトリの有効化

AL2023 インスタンスで NVIDIA リポジトリを有効にするには、 nvidia-releaseパッケージをインストールします。これにより、リポジトリ設定と GPG キーがシステムに追加されます。

[ec2-user ~]$ sudo dnf install nvidia-release -y

リポジトリが追加されていることを確認します。

[ec2-user ~]$ dnf repolist

amazonlinux-nvidia リポジトリがリストに表示されます。

repo id repo name status amazonlinux Amazon Linux 2023 repository enabled amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled

NVIDIA ドライバーのインストール

リポジトリを有効にしたら、 を使用して NVIDIA ドライバーパッケージをインストールできますdnf

  1. 実行中のカーネルのカーネルヘッダーと開発パッケージをインストールします。

    [ec2-user ~]$ sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
  2. NVIDIA ドライバーをインストールします。

    [ec2-user ~]$ sudo dnf install nvidia-driver-cuda -y
  3. インスタンスを再起動します。

    [ec2-user ~]$ sudo reboot
  4. 再起動後、ドライバーがロードされていることを確認します。

    [ec2-user ~]$ nvidia-smi

CUDA ツールキットのインストール

NVIDIA ドライバーをインストールしたら、CUDA ツールキットをインストールできます。

[ec2-user ~]$ sudo dnf install cuda-toolkit -y
注記

NVIDIA Fabric Manager を必要とする GPU インスタンス (P4d、P5、P6 インスタンスタイプなど) の場合は、追加のパッケージをインストールして有効にします。

[ec2-user ~]$ DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)" [ec2-user ~]$ sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y [ec2-user ~]$ sudo systemctl enable --now nvidia-fabricmanager [ec2-user ~]$ sudo systemctl enable --now nvidia-persistenced

Fabric Manager が実行されていて、GPUsが NVSwitch を介して接続されていることを確認します。

[ec2-user ~]$ sudo systemctl status nvidia-fabricmanager [ec2-user ~]$ nvidia-smi topo -m

トポロジマトリックスでは、GPUsにアクティブな NVSwitch 接続を示すNVリンクが表示されます。

インスタンスタイプ固有の要件など、EC2 GPU インスタンスに NVIDIA ドライバーをインストールする詳細な手順については、EC2 ユーザーガイドの「NVIDIA パブリックドライバーのインストール」を参照してください。

NVIDIA リポジトリの削除

システムから NVIDIA リポジトリ設定を削除するには:

[ec2-user ~]$ sudo dnf remove nvidia-release -y
重要

リポジトリ設定を削除しても、システムに既にインストールされている NVIDIA パッケージは削除されません。