

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Pilotes NVIDIA
<a name="nvidia-drivers"></a>

 Amazon Linux 2023 fournit des pilotes GPU NVIDIA et des packages de boîtes à outils CUDA via un référentiel dédié. Ce référentiel est géré par le [Amazon Linux Security Center (ALAS) AWS et fournit des avis de sécurité](https://alas.aws.amazon.com) par le biais de celui-ci. 

**Topics**
+ [À propos du référentiel NVIDIA](#nvidia-drivers-about)
+ [Activation du référentiel NVIDIA](#nvidia-drivers-install-repo)
+ [Installation des pilotes NVIDIA](#nvidia-drivers-install-driver)
+ [Installation de la boîte à outils CUDA](#nvidia-drivers-install-cuda)
+ [Suppression du référentiel NVIDIA](#nvidia-drivers-uninstall)

## À propos du référentiel NVIDIA
<a name="nvidia-drivers-about"></a>

 Le référentiel AL2023 NVIDIA reflète les packages [du référentiel officiel NVIDIA CUDA pour AL2023](https://docs.nvidia.com/cuda/cuda-installation-guide-linux/#amazon-installation). AWS qualifie les logiciels NVIDIA avec des AL2023 versions candidates avant de les redistribuer, et fournit des conseils de sécurité pour les packages de ce référentiel. 

 Le référentiel est disponible dans toutes les régions AWS commerciales, y compris les régions AWS GovCloud (États-Unis) et les régions de AWS Chine. 

 Le référentiel fournit NVIDIA Tesla (calcul pour centres de données) et des pilotes graphiques pour les architectures x86\_64. Les pilotes GRID, utilisés pour les fonctionnalités d'affichage virtuel et de station de travail à distance, ne sont pas inclus. Pour l'installation du pilote GRID, consultez la section [Installation des pilotes NVIDIA](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/install-nvidia-driver.html) dans le *guide de l'utilisateur EC2*. 

## Activation du référentiel NVIDIA
<a name="nvidia-drivers-install-repo"></a>

 Pour activer le référentiel NVIDIA sur votre AL2023 instance, installez le `nvidia-release` package. Cela ajoute la configuration du référentiel et les clés GPG à votre système. 

```
[ec2-user ~]$ sudo dnf install nvidia-release -y
```

Vérifiez que le référentiel a été ajouté :

```
[ec2-user ~]$ dnf repolist
```

Vous devriez voir le `amazonlinux-nvidia` dépôt dans la liste.

```
repo id                    repo name                                                status
amazonlinux                Amazon Linux 2023 repository                             enabled
amazonlinux-nvidia         Amazon Linux 2023 NVIDIA repository                      enabled
```

## Installation des pilotes NVIDIA
<a name="nvidia-drivers-install-driver"></a>

 Après avoir activé le référentiel, vous pouvez installer les packages de pilotes NVIDIA à l'aide de`dnf`. 

1. Installez les en-têtes du noyau et les packages de développement pour le noyau en cours d'exécution :

   ```
   [ec2-user ~]$ sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
   ```

1. Installez le pilote NVIDIA :

   ```
   [ec2-user ~]$ sudo dnf install nvidia-driver-cuda -y
   ```

1. Redémarrez l'instance :

   ```
   [ec2-user ~]$ sudo reboot
   ```

1. Après le redémarrage, vérifiez que le pilote est chargé :

   ```
   [ec2-user ~]$ nvidia-smi
   ```

## Installation de la boîte à outils CUDA
<a name="nvidia-drivers-install-cuda"></a>

 Après avoir installé le pilote NVIDIA, vous pouvez installer le kit d'outils CUDA : 

```
[ec2-user ~]$ sudo dnf install cuda-toolkit -y
```

**Note**  
 Pour les instances de GPU qui nécessitent NVIDIA Fabric Manager (telles que les types d'instances P4d, P5 et P6), installez et activez les packages supplémentaires :   

```
[ec2-user ~]$ DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)"
[ec2-user ~]$ sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y
[ec2-user ~]$ sudo systemctl enable --now nvidia-fabricmanager
[ec2-user ~]$ sudo systemctl enable --now nvidia-persistenced
```
Vérifiez que Fabric Manager est en cours d'exécution et qu' GPUs ils sont connectés via NVSwitch :  

```
[ec2-user ~]$ sudo systemctl status nvidia-fabricmanager
[ec2-user ~]$ nvidia-smi topo -m
```
Dans la matrice topologique, les connexions entre elles GPUs doivent afficher `NV` des liens, indiquant une NVSwitch connectivité active.

 Pour obtenir des instructions détaillées sur l'installation des pilotes NVIDIA sur les instances GPU EC2, y compris les exigences spécifiques au type d'instance, voir [Installer les pilotes publics NVIDIA](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/public-nvidia-driver.html) dans le guide de l'utilisateur *EC2*. 

## Suppression du référentiel NVIDIA
<a name="nvidia-drivers-uninstall"></a>

 Pour supprimer la configuration du référentiel NVIDIA de votre système : 

```
[ec2-user ~]$ sudo dnf remove nvidia-release -y
```

**Important**  
 La suppression de la configuration du référentiel ne supprime aucun package NVIDIA déjà installé sur le système. 