View a markdown version of this page

Pilotes NVIDIA - Amazon Linux 2023

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pilotes NVIDIA

Amazon Linux 2023 fournit des pilotes GPU NVIDIA et des packages de boîtes à outils CUDA via un référentiel dédié. Ce référentiel est géré par le Amazon Linux Security Center (ALAS) AWS et fournit des avis de sécurité par le biais de celui-ci.

À propos du référentiel NVIDIA

Le référentiel AL2023 NVIDIA reflète les packages du référentiel officiel NVIDIA CUDA pour AL2023. AWS qualifie les logiciels NVIDIA avec des AL2023 versions candidates avant de les redistribuer, et fournit des conseils de sécurité pour les packages de ce référentiel.

Le référentiel est disponible dans toutes les régions AWS commerciales, y compris les régions AWS GovCloud (États-Unis) et les régions de AWS Chine.

Le référentiel fournit NVIDIA Tesla (calcul pour centres de données) et des pilotes graphiques pour les architectures x86_64. Les pilotes GRID, utilisés pour les fonctionnalités d'affichage virtuel et de station de travail à distance, ne sont pas inclus. Pour l'installation du pilote GRID, consultez la section Installation des pilotes NVIDIA dans le guide de l'utilisateur EC2.

Activation du référentiel NVIDIA

Pour activer le référentiel NVIDIA sur votre AL2023 instance, installez le nvidia-release package. Cela ajoute la configuration du référentiel et les clés GPG à votre système.

[ec2-user ~]$ sudo dnf install nvidia-release -y

Vérifiez que le référentiel a été ajouté :

[ec2-user ~]$ dnf repolist

Vous devriez voir le amazonlinux-nvidia dépôt dans la liste.

repo id repo name status amazonlinux Amazon Linux 2023 repository enabled amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled

Installation des pilotes NVIDIA

Après avoir activé le référentiel, vous pouvez installer les packages de pilotes NVIDIA à l'aide dednf.

  1. Installez les en-têtes du noyau et les packages de développement pour le noyau en cours d'exécution :

    [ec2-user ~]$ sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
  2. Installez le pilote NVIDIA :

    [ec2-user ~]$ sudo dnf install nvidia-driver-cuda -y
  3. Redémarrez l'instance :

    [ec2-user ~]$ sudo reboot
  4. Après le redémarrage, vérifiez que le pilote est chargé :

    [ec2-user ~]$ nvidia-smi

Installation de la boîte à outils CUDA

Après avoir installé le pilote NVIDIA, vous pouvez installer le kit d'outils CUDA :

[ec2-user ~]$ sudo dnf install cuda-toolkit -y
Note

Pour les instances de GPU qui nécessitent NVIDIA Fabric Manager (telles que les types d'instances P4d, P5 et P6), installez et activez les packages supplémentaires :

[ec2-user ~]$ DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)" [ec2-user ~]$ sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y [ec2-user ~]$ sudo systemctl enable --now nvidia-fabricmanager [ec2-user ~]$ sudo systemctl enable --now nvidia-persistenced

Vérifiez que Fabric Manager est en cours d'exécution et qu' GPUs ils sont connectés via NVSwitch :

[ec2-user ~]$ sudo systemctl status nvidia-fabricmanager [ec2-user ~]$ nvidia-smi topo -m

Dans la matrice topologique, les connexions entre elles GPUs doivent afficher NV des liens, indiquant une NVSwitch connectivité active.

Pour obtenir des instructions détaillées sur l'installation des pilotes NVIDIA sur les instances GPU EC2, y compris les exigences spécifiques au type d'instance, voir Installer les pilotes publics NVIDIA dans le guide de l'utilisateur EC2.

Suppression du référentiel NVIDIA

Pour supprimer la configuration du référentiel NVIDIA de votre système :

[ec2-user ~]$ sudo dnf remove nvidia-release -y
Important

La suppression de la configuration du référentiel ne supprime aucun package NVIDIA déjà installé sur le système.