Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Driver NVIDIA
Amazon Linux 2023 fornisce driver GPU NVIDIA e pacchetti di toolkit CUDA tramite un repository dedicato. Questo repository è gestito AWS e fornisce avvisi di sicurezza tramite Amazon Linux Security Center (ALAS
Argomenti
Informazioni sul repository NVIDIA
Il repository AL2023 NVIDIA rispecchia i pacchetti del repository ufficiale NVIDIA CUDA per
L'archivio è disponibile in tutte le regioni AWS commerciali, incluse le regioni AWS GovCloud (Stati Uniti) e le regioni della AWS Cina.
Il repository fornisce driver NVIDIA Tesla (elaborazione per data center) e driver grafici per architetture x86_64. I driver GRID, utilizzati per le funzionalità di visualizzazione virtuale e workstation remote, non sono inclusi. Per l'installazione dei driver GRID, consulta Installare i driver NVIDIA nella Guida per l'utente EC2.
Abilitazione del repository NVIDIA
Per abilitare il repository NVIDIA sulla tua AL2023 istanza, installa il pacchetto. nvidia-release Questo aggiunge la configurazione del repository e le chiavi GPG al sistema.
[ec2-user ~]$sudo dnf install nvidia-release -y
Verifica che il repository sia stato aggiunto:
[ec2-user ~]$dnf repolist
Dovresti vedere il amazonlinux-nvidia repository nell'elenco.
repo id repo name status
amazonlinux Amazon Linux 2023 repository enabled
amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled
Installazione dei driver NVIDIA
Dopo aver abilitato il repository, è possibile installare i pacchetti driver NVIDIA utilizzando. dnf
-
Installa gli header del kernel e i pacchetti di sviluppo per il kernel in esecuzione:
[ec2-user ~]$sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y -
Installa il driver NVIDIA:
[ec2-user ~]$sudo dnf install nvidia-driver-cuda -y -
Riavvia l'istanza:
[ec2-user ~]$sudo reboot -
Dopo il riavvio, verifica che il driver sia caricato:
[ec2-user ~]$nvidia-smi
Installazione del toolkit CUDA
Dopo aver installato il driver NVIDIA, puoi installare il toolkit CUDA:
[ec2-user ~]$sudo dnf install cuda-toolkit -y
Nota
Per le istanze GPU che richiedono NVIDIA Fabric Manager (come i tipi di istanze P4d, P5 e P6), installa e abilita i pacchetti aggiuntivi:
[ec2-user ~]$DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)"[ec2-user ~]$sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y[ec2-user ~]$sudo systemctl enable --now nvidia-fabricmanager[ec2-user ~]$sudo systemctl enable --now nvidia-persistenced
Verifica che Fabric Manager sia in esecuzione e che siano connessi tramite: GPUs NVSwitch
[ec2-user ~]$sudo systemctl status nvidia-fabricmanager[ec2-user ~]$nvidia-smi topo -m
Nella matrice della topologia, le connessioni tra di loro GPUs dovrebbero mostrare NV dei collegamenti, a indicare la NVSwitch connettività attiva.
Per istruzioni dettagliate sull'installazione dei driver NVIDIA sulle istanze GPU EC2, inclusi i requisiti specifici del tipo di istanza, consulta Installare i driver pubblici NVIDIA nella Guida per l'utente di EC2.
Rimozione del repository NVIDIA
Per rimuovere la configurazione del repository NVIDIA dal sistema:
[ec2-user ~]$sudo dnf remove nvidia-release -y
Importante
La rimozione della configurazione del repository non rimuove i pacchetti NVIDIA già installati sul sistema.