Tipi di istanza per gli algoritmi integrati - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tipi di istanza per gli algoritmi integrati

La maggior parte degli algoritmi di SageMaker intelligenza artificiale di Amazon è stata progettata per sfruttare l'elaborazione tramite GPU per la formazione. Nonostante i costi più elevati per istanza, i corsi di GPUs formazione sono più rapidi, il che li rende più convenienti. Le eccezioni sono riportate in questa guida.

Per maggiori informazioni sulle EC2 istanze supportate, consulta i dettagli dell'istanza.

La dimensione e il tipo di dati possono avere conseguenze su quale configurazione hardware è più efficace. Quando lo stesso modello è addestrato su base ricorrente, il testing iniziale su un'ampia gamma di tipi di istanza può rilevare configurazioni che sono più convenienti a lungo termine. Inoltre, gli algoritmi che eseguono l'addestramento nel modo più efficiente GPUs potrebbero non GPUs richiedere un'inferenza efficiente. Esercitati per determinare la soluzione più conveniente dal punto di vista dei costi. Per ottenere una raccomandazione automatica sull'istanza o eseguire test di carico personalizzati, usa Amazon SageMaker Inference Recommender.

Per ulteriori informazioni sulle specifiche hardware SageMaker AI, consulta i tipi di istanze di Amazon SageMaker AI ML.

UltraServers

UltraServers connetti più EC2 istanze Amazon utilizzando un'interconnessione acceleratrice a bassa latenza e larghezza di banda elevata. Sono progettati per gestire carichi di lavoro su larga scala AI/ML che richiedono una potenza di elaborazione significativa. Per ulteriori informazioni, consulta Amazon EC2 UltraServers. Per iniziare UltraServers, consulta Prenota i piani di formazione per i tuoi lavori o HyperPod cluster di formazione.

Per iniziare a usare UltraServers Amazon SageMaker AI, crea un piano di formazione. Una volta UltraServer che il tuo è disponibile nel piano di formazione, crea un lavoro di formazione con l' AWS Management Console API Amazon SageMaker AI o AWS CLI. Ricordati di specificare il tipo di UltraServer istanza che hai acquistato nel piano di formazione.

E UltraServer può eseguire uno o più lavori alla volta. UltraServers raggruppa le istanze, il che offre una certa flessibilità in termini di allocazione delle UltraServer capacità all'interno dell'organizzazione. Durante la configurazione dei lavori, ricorda anche le linee guida sulla sicurezza dei dati della tua organizzazione, poiché le istanze di una di esse UltraServer possono accedere ai dati di un altro lavoro in un'altra istanza sulla stessa. UltraServer

Se riscontri un guasto hardware in UltraServer, l' SageMaker IA tenta automaticamente di risolvere il problema. Man mano che l' SageMaker IA indaga e risolve il problema, potresti ricevere notifiche e azioni tramite Eventi o. AWS Health Supporto AWS

Una volta terminato il processo di formazione, l' SageMaker intelligenza artificiale interrompe le istanze, ma queste rimangono disponibili nel piano di formazione se il piano è ancora attivo. Per mantenere UltraServer attiva un'istanza al termine di un processo, puoi utilizzare pool caldi gestiti.

Se il tuo piano di formazione ha una capacità sufficiente, puoi persino eseguire diversi lavori di formazione su più livelli UltraServers. Per impostazione predefinita, ogni istanza UltraServer è dotata di 18 istanze, di cui 17 istanze e 1 istanza di riserva. Se hai bisogno di più istanze, devi acquistarne altre. UltraServers Quando si crea un lavoro di formazione, è possibile configurare il modo in cui i lavori vengono posizionati UltraServers utilizzando il InstancePlacementConfig parametro.

Se non configuri l'inserimento lavorativo, l' SageMaker IA assegna automaticamente i lavori alle istanze all'interno del tuo. UltraServer Questa strategia predefinita si basa sul massimo impegno e dà priorità al riempimento di tutte le istanze in un'unica UltraServer istanza prima di utilizzarne un'altra. UltraServer Ad esempio, se richiedi 14 istanze e ne hai 2 UltraServers nel tuo piano di allenamento, l' SageMaker IA utilizza tutte le istanze della prima. UltraServer Se hai richiesto 20 istanze e ne hai 2 UltraServers nel tuo piano di allenamento, l' SageMaker IA utilizzerà tutte le 17 istanze nella prima UltraServer e poi ne utilizzerà 3 nella seconda. UltraServer Le istanze utilizzate NVLink per comunicare, ma individuali UltraServer UltraServers utilizzano Elastic Fabric Adapter (EFA), che potrebbe influire sulle prestazioni di addestramento dei modelli.