

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# NVIDIA ドライバー
<a name="nvidia-drivers"></a>

 Amazon Linux 2023 は、専用リポジトリを通じて NVIDIA GPU ドライバーと CUDA ツールキットパッケージを提供します。このリポジトリは によって管理 AWS され、[Amazon Linux セキュリティセンター (ALAS)](https://alas.aws.amazon.com) を通じてセキュリティアドバイザリを提供します。

**Topics**
+ [NVIDIA リポジトリについて](#nvidia-drivers-about)
+ [NVIDIA リポジトリの有効化](#nvidia-drivers-install-repo)
+ [NVIDIA ドライバーのインストール](#nvidia-drivers-install-driver)
+ [CUDA ツールキットのインストール](#nvidia-drivers-install-cuda)
+ [NVIDIA リポジトリの削除](#nvidia-drivers-uninstall)

## NVIDIA リポジトリについて
<a name="nvidia-drivers-about"></a>

 AL2023 NVIDIA リポジトリは、[AL2023 の公式 NVIDIA CUDA リポジトリ](https://docs.nvidia.com/cuda/cuda-installation-guide-linux/#amazon-installation)からのパッケージをミラーリングします。 は、再配布前に AL2023 リリース候補で NVIDIA ソフトウェアを AWS 認定し、このリポジトリ内のパッケージのセキュリティアドバイザリを提供します。

 リポジトリは、 GovCloud (米国) リージョンや AWS 中国リージョンなど AWS 、すべての AWS 商用リージョンで利用できます。

 リポジトリは、x86\_64 アーキテクチャ用の NVIDIA Tesla (データセンターコンピューティング) とグラフィックスドライバーを提供します。仮想ディスプレイおよびリモートワークステーション機能に使用される GRID ドライバーは含まれません。GRID ドライバーのインストールについては、*EC2 * [ユーザーガイドの「NVIDIA ドライバー](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/install-nvidia-driver.html)のインストール」を参照してください。

## NVIDIA リポジトリの有効化
<a name="nvidia-drivers-install-repo"></a>

 AL2023 インスタンスで NVIDIA リポジトリを有効にするには、 `nvidia-release`パッケージをインストールします。これにより、リポジトリ設定と GPG キーがシステムに追加されます。

```
[ec2-user ~]$ sudo dnf install nvidia-release -y
```

リポジトリが追加されていることを確認します。

```
[ec2-user ~]$ dnf repolist
```

`amazonlinux-nvidia` リポジトリがリストに表示されます。

```
repo id                    repo name                                                status
amazonlinux                Amazon Linux 2023 repository                             enabled
amazonlinux-nvidia         Amazon Linux 2023 NVIDIA repository                      enabled
```

## NVIDIA ドライバーのインストール
<a name="nvidia-drivers-install-driver"></a>

 リポジトリを有効にしたら、 を使用して NVIDIA ドライバーパッケージをインストールできます`dnf`。

1. 実行中のカーネルのカーネルヘッダーと開発パッケージをインストールします。

   ```
   [ec2-user ~]$ sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
   ```

1. NVIDIA ドライバーをインストールします。

   ```
   [ec2-user ~]$ sudo dnf install nvidia-driver-cuda -y
   ```

1. インスタンスを再起動します。

   ```
   [ec2-user ~]$ sudo reboot
   ```

1. 再起動後、ドライバーがロードされていることを確認します。

   ```
   [ec2-user ~]$ nvidia-smi
   ```

## CUDA ツールキットのインストール
<a name="nvidia-drivers-install-cuda"></a>

 NVIDIA ドライバーをインストールしたら、CUDA ツールキットをインストールできます。

```
[ec2-user ~]$ sudo dnf install cuda-toolkit -y
```

**注記**  
 NVIDIA Fabric Manager を必要とする GPU インスタンス (P4d、P5、P6 インスタンスタイプなど) の場合は、追加のパッケージをインストールして有効にします。  

```
[ec2-user ~]$ DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)"
[ec2-user ~]$ sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y
[ec2-user ~]$ sudo systemctl enable --now nvidia-fabricmanager
[ec2-user ~]$ sudo systemctl enable --now nvidia-persistenced
```
Fabric Manager が実行されていて、GPUsが NVSwitch を介して接続されていることを確認します。  

```
[ec2-user ~]$ sudo systemctl status nvidia-fabricmanager
[ec2-user ~]$ nvidia-smi topo -m
```
トポロジマトリックスでは、GPUsにアクティブな NVSwitch 接続を示す`NV`リンクが表示されます。

 インスタンスタイプ固有の要件など、EC2 GPU インスタンスに NVIDIA ドライバーをインストールする詳細な手順については、*EC2 * [ユーザーガイドの「NVIDIA パブリックドライバー](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/public-nvidia-driver.html)のインストール」を参照してください。

## NVIDIA リポジトリの削除
<a name="nvidia-drivers-uninstall"></a>

 システムから NVIDIA リポジトリ設定を削除するには: 

```
[ec2-user ~]$ sudo dnf remove nvidia-release -y
```

**重要**  
 リポジトリ設定を削除しても、システムに既にインストールされている NVIDIA パッケージは削除されません。