Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di un SageMaker HyperPod cluster con l'orchestrazione di Amazon EKS
Il seguente tutorial dimostra come creare un nuovo SageMaker HyperPod cluster e configurarlo con l'orchestrazione di Amazon EKS tramite l'interfaccia utente della console SageMaker AI.
In questo argomento:
Creazione di un cluster
Per accedere alla pagina SageMaker HyperPod Clusters e scegliere l'orchestrazione di Amazon EKS, segui questi passaggi.
Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/
. -
Scegli HyperPod Clusters nel riquadro di navigazione a sinistra, quindi Cluster Management.
-
Nella pagina SageMaker HyperPod Cluster, scegli Crea HyperPod cluster.
-
Nel menu a discesa Crea HyperPod cluster, scegli Orchestrated by Amazon EKS.
-
Nella pagina di creazione del cluster EKS, vedrai due opzioni, scegli l'opzione più adatta alle tue esigenze.
-
Configurazione rapida: per iniziare subito con le impostazioni predefinite, scegli Configurazione rapida. Con questa opzione, l' SageMaker IA creerà nuove risorse come VPC, sottoreti, gruppi di sicurezza, bucket Amazon S3, ruolo IAM e FSx for Lustre nel processo di creazione del cluster.
-
Configurazione personalizzata: per l'integrazione con AWS le risorse esistenti o per soddisfare requisiti di rete, sicurezza o storage specifici, scegli Configurazione personalizzata. Con questa opzione, puoi scegliere di utilizzare le risorse esistenti o crearne di nuove e puoi personalizzare la configurazione più adatta alle tue esigenze.
-
Configurazione rapida
Nella sezione Configurazione rapida, segui questi passaggi per creare il tuo HyperPod cluster con l'orchestrazione di Amazon EKS.
Specificare un nome per il nuovo cluster. Non è possibile modificare il nome dopo la creazione del cluster.
Per aggiungere un gruppo di istanze, scegli Aggiungi gruppo. Ogni gruppo di istanze può essere configurato in modo diverso ed è possibile creare un cluster eterogeneo composto da più gruppi di istanze con vari tipi di istanze. Per distribuire un cluster, è necessario aggiungere almeno un gruppo di istanze. Segui questi passaggi per aggiungere un gruppo di istanze.
-
Per Tipo di gruppo di istanze, scegli Standard o Restricted Instance Group (RIG). In genere, sceglierai Standard, che fornisce un ambiente informatico generico senza restrizioni di sicurezza aggiuntive. Restricted Instance Group (RIG) è un ambiente specializzato per la personalizzazione di modelli fondamentali come Amazon Nova. Per ulteriori informazioni sulla configurazione di RIG per la personalizzazione del modello Amazon Nova, consulta. Personalizzazione di Amazon Nova su Amazon SageMaker HyperPod
-
Per Nome, specifica un nome per il gruppo di istanze.
-
Ad esempio, scegli la capacità su richiesta o un piano di formazione per riservare le tue risorse di elaborazione.
-
Per Tipo di istanza, scegli l'istanza per il gruppo di istanze. Assicurati di scegliere il tipo di istanza con quote sufficienti nel tuo account oppure richiedi quote aggiuntive seguendo l'indirizzo. SageMaker HyperPod quote
-
Per la quantità dell'istanza, specifica un numero intero che non superi la quota di istanza per l'utilizzo del cluster. Per questo tutorial, inserisci 1 per tutti e tre i gruppi.
-
Per Target Availability Zone, scegli la zona di disponibilità in cui verranno distribuite le tue istanze. La zona di disponibilità deve corrispondere alla posizione della capacità di elaborazione accelerata.
-
Per Volume di storage aggiuntivo per istanza (GB), facoltativo, specifica un numero intero compreso tra 1 e 16384 per impostare la dimensione di un volume Elastic Block Store (EBS) aggiuntivo in gigabyte (GB). Il volume EBS è collegato a ciascuna istanza del gruppo di istanze. Il percorso di montaggio predefinito per il volume EBS aggiuntivo è.
/opt/sagemaker
Dopo aver creato correttamente il cluster, è possibile accedere tramite SSH alle istanze del cluster (nodi) e verificare se il volume EBS è montato correttamente eseguendo il comando.df -h
Il collegamento di un volume EBS aggiuntivo fornisce uno storage stabile, fuori istanza e persistente in modo indipendente, come descritto nella sezione Volumi Amazon EBS della Amazon Elastic Block Store User Guide. -
Ad esempio, controlli sanitari approfonditi, scegli la tua opzione. I controlli approfonditi dello stato delle istanze monitorano lo stato delle istanze durante la creazione e dopo gli aggiornamenti software, ripristinando automaticamente le istanze difettose tramite riavvii o sostituzioni, se abilitati.
-
Scegli Aggiungi gruppo di istanze.
Questa sezione elenca tutte le impostazioni predefinite per la creazione del cluster, incluse tutte le nuove AWS risorse che verranno create durante il processo di creazione del cluster. Verificare le impostazioni predefinite.
Configurazione personalizzata
Nella sezione Configurazione personalizzata, segui questi passaggi per creare il tuo primo HyperPod cluster con l'orchestrazione di Amazon EKS.
Specificare un nome per il nuovo cluster. Non è possibile modificare il nome dopo la creazione del cluster.
Per il ripristino dell'esempio, scegli Automatico - consigliato o Nessuno.
Configura le impostazioni di rete all'interno in-and-out del cluster e del cluster. Per l'orchestrazione del SageMaker HyperPod cluster con Amazon EKS, il VPC viene impostato automaticamente su quello configurato con il cluster EKS selezionato.
-
Per quanto riguarda il VPC, scegli il tuo VPC se ne hai già uno che consente all' SageMaker IA di accedere al tuo VPC. Per creare un nuovo VPC, segui le istruzioni in Crea un VPC nella Guida per l'utente di Amazon Virtual Private Cloud. Puoi lasciarlo su Nessuno per utilizzare il VPC SageMaker AI predefinito.
-
Per il blocco VPC IPv4 CIDR, inserisci l'IP iniziale del tuo VPC.
-
Per le zone di disponibilità, scegli le zone di disponibilità (AZ) in cui HyperPod verranno create le sottoreti per il tuo cluster. Scegli AZs quella che corrisponde alla posizione della tua capacità di elaborazione accelerata.
-
Per i gruppi di sicurezza, scegli gruppi di sicurezza collegati al cluster Amazon EKS o il cui traffico in entrata è consentito dal gruppo di sicurezza associato al cluster Amazon EKS. Per creare nuovi gruppi di sicurezza, accedi alla console Amazon VPC.
Segui questi passaggi per creare o selezionare un cluster Amazon EKS da utilizzare come orchestratore.
-
Per il cluster EKS, scegli di creare un nuovo cluster Amazon EKS o di utilizzarne uno esistente.
Se devi creare un nuovo cluster EKS, puoi crearlo dalla sezione cluster EKS senza dover aprire la console Amazon EKS.
Nota
La sottorete VPC scelta HyperPod deve essere privata.
Dopo aver inviato una nuova richiesta di creazione di un cluster EKS, attendi che il cluster EKS diventi.
Active
-
Per la versione Kubernetes, scegli una versione dal menu a discesa. Per ulteriori informazioni sulle versioni di Kubernetes, consulta Comprendere il ciclo di vita delle versioni Kubernetes su EKS dalla Amazon EKS User Guide.
-
Per gli operatori, scegli Usa grafici e componenti aggiuntivi di Helm predefiniti o Non installare operatori. L'opzione predefinita è Usa grafici e componenti aggiuntivi Helm predefiniti, che verranno utilizzati per installare gli operatori sul cluster EKS. Per ulteriori informazioni sui grafici e sui componenti aggiuntivi di Helm predefiniti, consulta dal repository.
helm_chart
GitHub Per ulteriori informazioni, consulta Installazione di pacchetti sul cluster Amazon EKS tramite Helm. -
Per Operatori abilitati, visualizza l'elenco degli operatori abilitati. Per modificare gli operatori, deseleziona la casella in alto e scegli gli operatori da abilitare per il cluster EKS.
Nota
Per utilizzarlo HyperPod con EKS, è necessario installare i grafici Helm e i componenti aggiuntivi che abilitano gli operatori sul cluster EKS. Questi componenti configurano EKS come piano di controllo HyperPod e forniscono la configurazione necessaria per la gestione e l'orchestrazione del carico di lavoro.
Per aggiungere un gruppo di istanze, scegli Aggiungi gruppo. Ogni gruppo di istanze può essere configurato in modo diverso ed è possibile creare un cluster eterogeneo composto da più gruppi di istanze con vari tipi di istanze. Per distribuire un cluster, è necessario aggiungere almeno un gruppo di istanze. Segui questi passaggi per aggiungere un gruppo di istanze.
-
Per Tipo di gruppo di istanze, scegli Standard o Restricted Instance Group (RIG). In genere, sceglierai Standard, che fornisce un ambiente informatico generico senza restrizioni di sicurezza aggiuntive. Restricted Instance Group (RIG) è un ambiente specializzato per la personalizzazione di modelli fondamentali come Amazon Nova. Per ulteriori informazioni sulla configurazione di RIG per la personalizzazione del modello Amazon Nova, consulta. Personalizzazione di Amazon Nova su Amazon SageMaker HyperPod
-
Per Nome, specifica un nome per il gruppo di istanze.
-
Ad esempio, scegli la capacità su richiesta o un piano di formazione per riservare le tue risorse di elaborazione.
-
Per Tipo di istanza, scegli l'istanza per il gruppo di istanze. Assicurati di scegliere il tipo di istanza con quote sufficienti nel tuo account oppure richiedi quote aggiuntive seguendo l'indirizzo. SageMaker HyperPod quote
-
Per la quantità dell'istanza, specifica un numero intero che non superi la quota di istanza per l'utilizzo del cluster. Per questo tutorial, inserisci 1 per tutti e tre i gruppi.
-
Per Target Availability Zone, scegli la zona di disponibilità in cui verranno distribuite le tue istanze. La zona di disponibilità deve corrispondere alla posizione della capacità di elaborazione accelerata.
-
Per Volume di storage aggiuntivo per istanza (GB), facoltativo, specifica un numero intero compreso tra 1 e 16384 per impostare la dimensione di un volume Elastic Block Store (EBS) aggiuntivo in gigabyte (GB). Il volume EBS è collegato a ciascuna istanza del gruppo di istanze. Il percorso di montaggio predefinito per il volume EBS aggiuntivo è.
/opt/sagemaker
Dopo aver creato correttamente il cluster, è possibile accedere tramite SSH alle istanze del cluster (nodi) e verificare se il volume EBS è montato correttamente eseguendo il comando.df -h
Il collegamento di un volume EBS aggiuntivo fornisce uno storage stabile, fuori istanza e persistente in modo indipendente, come descritto nella sezione Volumi Amazon EBS della Amazon Elastic Block Store User Guide. -
Ad esempio, controlli sanitari approfonditi, scegli la tua opzione. I controlli approfonditi dello stato delle istanze monitorano lo stato delle istanze durante la creazione e dopo gli aggiornamenti software, ripristinando automaticamente le istanze difettose tramite riavvii o sostituzioni, se abilitati. Per ulteriori informazioni, consulta Controlli sanitari approfonditi
-
Scegli Aggiungi gruppo di istanze.
Puoi scegliere di utilizzare gli script del ciclo di vita predefiniti o gli script del ciclo di vita personalizzati, che verranno archiviati nel tuo bucket Amazon S3. Puoi visualizzare gli script del ciclo di vita predefiniti nell'archivio Awesome Distributed Training. GitHub
-
Per gli script del ciclo di vita, scegli di utilizzare script del ciclo di vita predefiniti o personalizzati.
-
Per gli script del bucket S3 per il ciclo di vita, scegli di creare un nuovo bucket o di utilizzare un bucket esistente per archiviare gli script del ciclo di vita.
Scegli o crea un ruolo IAM che HyperPod consenta di eseguire e accedere alle risorse necessarie per tuo conto. AWS Per ulteriori informazioni, consulta Ruolo IAM per SageMaker HyperPod.
Configura il file system FSx for Lustre da fornire sul HyperPod cluster.
-
Per File system, scegliete un file system FSx for Lustre esistente, FSx per crearne uno nuovo, oppure non installatene uno FSx per Lustre.
-
Per Throughput per unità di storage, scegli il throughput che sarà disponibile per TiB di storage assegnato.
-
Per Capacità di storage, inserisci un valore di capacità in TB.
-
Per Tipo di compressione dei dati, scegli LZ4di abilitare la compressione dei dati.
-
Per la versione Lustre, visualizza il valore consigliato per i nuovi file system.
Per i tag: opzionale, aggiungi coppie di chiavi e valori al nuovo cluster e gestisci il cluster come AWS risorsa. Per ulteriori informazioni, consulta Taggare le AWS risorse.
Distribuzione delle risorse
Dopo aver completato le configurazioni del cluster utilizzando Configurazione rapida o Configurazione personalizzata, scegli la seguente opzione per avviare il provisioning delle risorse e la creazione del cluster.
-
Invia: SageMaker AI inizierà a fornire le risorse di configurazione predefinite e a creare il cluster.
-
Scarica i parametri del CloudFormation modello: scaricherai il file JSON dei parametri di configurazione ed eseguirai il AWS CLI comando per distribuire lo CloudFormation stack per fornire le risorse di configurazione e creare il cluster. Se necessario, è possibile modificare il file JSON dei parametri scaricato. Se scegli questa opzione, consulta ulteriori istruzioni inCreazione di SageMaker HyperPod cluster utilizzando modelli AWS CloudFormation.