View a markdown version of this page

Driver NVIDIA - Amazon Linux 2023

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Driver NVIDIA

Amazon Linux 2023 fornisce driver GPU NVIDIA e pacchetti di toolkit CUDA tramite un repository dedicato. Questo repository è gestito AWS e fornisce avvisi di sicurezza tramite Amazon Linux Security Center (ALAS).

Informazioni sul repository NVIDIA

Il repository AL2023 NVIDIA rispecchia i pacchetti del repository ufficiale NVIDIA CUDA per. AL2023 AWS qualifica il software NVIDIA con AL2023 release candidate prima della ridistribuzione e fornisce avvisi di sicurezza per i pacchetti contenuti in questo repository.

L'archivio è disponibile in tutte le regioni AWS commerciali, incluse le regioni AWS GovCloud (Stati Uniti) e le regioni della AWS Cina.

Il repository fornisce driver NVIDIA Tesla (elaborazione per data center) e driver grafici per architetture x86_64. I driver GRID, utilizzati per le funzionalità di visualizzazione virtuale e workstation remote, non sono inclusi. Per l'installazione dei driver GRID, consulta Installare i driver NVIDIA nella Guida per l'utente EC2.

Abilitazione del repository NVIDIA

Per abilitare il repository NVIDIA sulla tua AL2023 istanza, installa il pacchetto. nvidia-release Questo aggiunge la configurazione del repository e le chiavi GPG al sistema.

[ec2-user ~]$ sudo dnf install nvidia-release -y

Verifica che il repository sia stato aggiunto:

[ec2-user ~]$ dnf repolist

Dovresti vedere il amazonlinux-nvidia repository nell'elenco.

repo id repo name status amazonlinux Amazon Linux 2023 repository enabled amazonlinux-nvidia Amazon Linux 2023 NVIDIA repository enabled

Installazione dei driver NVIDIA

Dopo aver abilitato il repository, è possibile installare i pacchetti driver NVIDIA utilizzando. dnf

  1. Installa gli header del kernel e i pacchetti di sviluppo per il kernel in esecuzione:

    [ec2-user ~]$ sudo dnf install kernel-devel-$(uname -r) kernel-headers-$(uname -r) -y
  2. Installa il driver NVIDIA:

    [ec2-user ~]$ sudo dnf install nvidia-driver-cuda -y
  3. Riavvia l'istanza:

    [ec2-user ~]$ sudo reboot
  4. Dopo il riavvio, verifica che il driver sia caricato:

    [ec2-user ~]$ nvidia-smi

Installazione del toolkit CUDA

Dopo aver installato il driver NVIDIA, puoi installare il toolkit CUDA:

[ec2-user ~]$ sudo dnf install cuda-toolkit -y
Nota

Per le istanze GPU che richiedono NVIDIA Fabric Manager (come i tipi di istanze P4d, P5 e P6), installa e abilita i pacchetti aggiuntivi:

[ec2-user ~]$ DRV_BRANCH="$(modinfo nvidia | grep "^version:" | tr -s ' ' | cut -d ' ' -f 2)" [ec2-user ~]$ sudo dnf install nvidia-fabricmanager-${DRV_BRANCH} -y [ec2-user ~]$ sudo systemctl enable --now nvidia-fabricmanager [ec2-user ~]$ sudo systemctl enable --now nvidia-persistenced

Verifica che Fabric Manager sia in esecuzione e che siano connessi tramite: GPUs NVSwitch

[ec2-user ~]$ sudo systemctl status nvidia-fabricmanager [ec2-user ~]$ nvidia-smi topo -m

Nella matrice della topologia, le connessioni tra di loro GPUs dovrebbero mostrare NV dei collegamenti, a indicare la NVSwitch connettività attiva.

Per istruzioni dettagliate sull'installazione dei driver NVIDIA sulle istanze GPU EC2, inclusi i requisiti specifici del tipo di istanza, consulta Installare i driver pubblici NVIDIA nella Guida per l'utente di EC2.

Rimozione del repository NVIDIA

Per rimuovere la configurazione del repository NVIDIA dal sistema:

[ec2-user ~]$ sudo dnf remove nvidia-release -y
Importante

La rimozione della configurazione del repository non rimuove i pacchetti NVIDIA già installati sul sistema.