Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Pilotes NVIDIA
Amazon Linux 2023 fournit des pilotes GPU NVIDIA et des packages de boîtes à outils CUDA via un référentiel dédié. Ce référentiel est géré par le Amazon Linux Security Center (ALAS) AWS et fournit des avis de sécurité
Rubriques
À propos du référentiel NVIDIA
Le référentiel AL2023 NVIDIA reflète les packages du référentiel officiel NVIDIA CUDA pour AL2023
Le référentiel est disponible dans toutes les régions AWS commerciales, y compris les régions AWS GovCloud (États-Unis) et les régions de AWS Chine.
Le référentiel fournit NVIDIA Tesla (calcul pour centres de données) et des pilotes graphiques pour les architectures x86_64. Les pilotes GRID, utilisés pour les fonctionnalités d'affichage virtuel et de station de travail à distance, ne sont pas inclus. Pour l'installation du pilote GRID, consultez la section Installation des pilotes NVIDIA dans le guide de l'utilisateur EC2.
Activation du référentiel NVIDIA
Pour activer le référentiel NVIDIA sur votre AL2023 instance, installez le nvidia-release package. Cela ajoute la configuration du référentiel et les clés GPG à votre système.
[ec2-user ~]$sudo dnf install nvidia-release -y
Vérifiez que le référentiel a été ajouté :
[ec2-user ~]$dnf repolist
Vous devriez voir le amazonlinux-nvidia dépôt dans la liste.
repo id repo name status
amazonlinux Amazon Linux 2023 repository enabled
amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled
Installation des pilotes NVIDIA
Après avoir activé le référentiel, vous pouvez installer les packages de pilotes NVIDIA à l'aide dednf.
-
Installez les en-têtes du noyau et les packages de développement pour le noyau en cours d'exécution :
[ec2-user ~]$sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y -
Installez le pilote NVIDIA :
[ec2-user ~]$sudo dnf install nvidia-driver-cuda -y -
Redémarrez l'instance :
[ec2-user ~]$sudo reboot -
Après le redémarrage, vérifiez que le pilote est chargé :
[ec2-user ~]$nvidia-smi
Installation de la boîte à outils CUDA
Après avoir installé le pilote NVIDIA, vous pouvez installer le kit d'outils CUDA :
[ec2-user ~]$sudo dnf install cuda-toolkit -y
Note
Pour les instances de GPU qui nécessitent NVIDIA Fabric Manager (telles que les types d'instances P4d, P5 et P6), installez et activez les packages supplémentaires :
[ec2-user ~]$DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)"[ec2-user ~]$sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y[ec2-user ~]$sudo systemctl enable --now nvidia-fabricmanager[ec2-user ~]$sudo systemctl enable --now nvidia-persistenced
Vérifiez que Fabric Manager est en cours d'exécution et qu' GPUs ils sont connectés via NVSwitch :
[ec2-user ~]$sudo systemctl status nvidia-fabricmanager[ec2-user ~]$nvidia-smi topo -m
Dans la matrice topologique, les connexions entre elles GPUs doivent afficher NV des liens, indiquant une NVSwitch connectivité active.
Pour obtenir des instructions détaillées sur l'installation des pilotes NVIDIA sur les instances GPU EC2, y compris les exigences spécifiques au type d'instance, voir Installer les pilotes publics NVIDIA dans le guide de l'utilisateur EC2.
Suppression du référentiel NVIDIA
Pour supprimer la configuration du référentiel NVIDIA de votre système :
[ec2-user ~]$sudo dnf remove nvidia-release -y
Important
La suppression de la configuration du référentiel ne supprime aucun package NVIDIA déjà installé sur le système.