Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Configurazione dei client EFA
Utilizza le seguenti procedure per configurare il client Lustre per accedere a un file system FSx for Lustre tramite Elastic Fabric Adapter (EFA).
EFA è supportato sui client Lustre che eseguono i seguenti sistemi operativi:
Amazon Linux 2023 (AL2023)
Red Hat Enterprise Linux (RHEL) 9.5 o versione successiva
Ubuntu 22.04 o versione successiva con versione del kernel 6.8+
EFA è supportato sui client Lustre elencati di seguito. Per ulteriori informazioni, consulta Installazione del client Lustre.
EFA è supportato sulle istanze Nitro v4 (o superiore) che supportano EFA, esclusa la famiglia di EC2 istanze trn2. Consulta i tipi di istanze supportati nella Amazon EC2 User Guide.
Argomenti
Passaggio 1: installa i driver richiesti
Nota
Se utilizzi un'AMI Deep Learning, puoi saltare questo passaggio poiché sia il driver EFA che il driver NVIDIA GPUDirect Storage (GDS) sono preinstallati.
Installa il driver EFA
Segui le istruzioni nella Fase 3: Installa il software EFA nella Amazon EC2 User Guide.
Installa il driver GDS (opzionale)
Questo passaggio è necessario solo se prevedi di utilizzare NVIDIA GPUDirect Storage (GDS) con FSx for Lustre.
Requisiti:
Istanza Amazon EC2 P5, P5e, P5en, P6-B200 o P6e-00 GB2
Driver NVIDIA GDS versione 2.24.2 o successiva
Per installare il driver di GPUDirect archiviazione NVIDIA sull'istanza client
Clona il repository NVIDIA GDS:
git clone https://github.com/NVIDIA/gds-nvidia-fs.git
Compila e installa il driver:
cd gds-nvidia-fs/src/ export NVFS_MAX_PEER_DEVS=128 export NVFS_MAX_PCI_DEPTH=16 sudo -E make sudo insmod nvidia-fs.ko
Fase 2: Configurare EFA per il client Lustre
Per accedere a un file system FSx for Lustre utilizzando un'interfaccia EFA, è necessario installare i moduli Lustre EFA e configurare le interfacce EFA.
Configurazione rapida
Per configurare rapidamente il client Lustre
Connect alla tua EC2 istanza Amazon.
Scarica e decomprimi il file contenente lo script di configurazione:
curl -O https://docs.aws.amazon.com/fsx/latest/LustreGuide/samples/configure-efa-fsx-lustre-client.zip unzip configure-efa-fsx-lustre-client.zip
Passa alla
configure-efa-fsx-lustre-client
cartella ed esegui lo script di installazione:cd
configure-efa-fsx-lustre-client
sudo ./setup.shLo script esegue automaticamente le seguenti operazioni:
Importa i moduli Lustre
Configura le interfacce TCP ed EFA
Crea un servizio systemd per la configurazione automatica al riavvio
Per un elenco di opzioni ed esempi di utilizzo utilizzabili con lo
setup.sh
script, consultate ilREADME.md
file nel file zip.
Gestione manuale del servizio systemd
Il file di servizio systemd viene creato in/etc/systemd/system/configure- efa-fsx-lustre-client .service. Di seguito sono riportati alcuni utili comandi relativi al sistema:
# Check status sudo systemctl status configure-efa-fsx-lustre-client.service # View logs sudo journalctl -u configure-efa-fsx-lustre-client.service # View warnings/errors from dmesg sudo dmesg
Per ulteriori informazioni, consultate il README.md
file nel file zip.
Configurazione di montaggio automatico (opzionale)
Per informazioni sul montaggio automatico del file system Amazon FSx for Lustre all'avvio, consultaMontaggio automatico FSx del file system Amazon.
Fase 3: interfacce EFA
Ciascun file system FSx for Lustre ha un limite massimo di 1024 connessioni EFA su tutte le istanze client.
Lo configure-efa-fsx-lustre-client.sh
script configura automaticamente le interfacce EFA in base al tipo di istanza.
Tipo di istanza | Numero predefinito di interfacce EFA |
---|---|
p6e-gb200,3xlarge | 8 |
p6-b 200,48 x grande | 8 |
p5en. 48 x grande | 8 |
p 5 e.48 x grande | 8 |
p5.48xlarge | 8 |
Altre istanze con più schede di rete | 2 |
Altre istanze con una singola scheda di rete | 1 |
Ogni interfaccia EFA configurata su un'istanza client conta come una connessione rispetto al limite di 1024 connessioni EFA quando è connessa a un file system FSx for Lustre.
Gestione manuale delle interfacce EFA
Le istanze con più interfacce EFA in genere supportano un throughput più elevato. È possibile personalizzare il numero di interfacce per ottimizzare le prestazioni per carichi di lavoro specifici, purché si rimanga entro il limite totale di connessioni EFA.
È possibile gestire manualmente le interfacce EFA utilizzando i seguenti comandi:
Visualizza i dispositivi EFA disponibili:
for interface in /sys/class/infiniband/*; do if [ ! -e "$interface/device/driver" ]; then continue; fi driver=$(basename "$(realpath "$interface/device/driver")") if [ "$driver" != "efa" ]; then continue; fi echo $(basename $interface) done
Visualizza le interfacce attualmente configurate:
sudo lnetctl net show
Aggiungi un'interfaccia EFA:
sudo lnetctl net add --net efa --if
device_name
—peer-credits 32Sostituisci
device_name
con un nome effettivo del dispositivo dall'elenco al passaggio 1.Rimuovi un'interfaccia EFA:
sudo lnetctl net del --net efa --if
device_name
Sostituisci
device_name
con un nome effettivo del dispositivo dall'elenco al passaggio 2.