Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Istanze Inferent
AWSLe istanze Inferent In particolare, i tipi di istanze Inf2 utilizzano i chip AWS Inferentia e l'SDK AWS Neuron
I clienti possono utilizzare le istanze di Inf2 per eseguire applicazioni di inferenza di apprendimento automatico su larga scala come ricerca, motori di raccomandazione, visione artificiale, riconoscimento vocale, elaborazione del linguaggio naturale, personalizzazione e rilevamento delle frodi, al costo più basso del cloud.
Nota
La dimensione del modello dovrebbe essere un elemento di selezione di un'istanza. Se il modello supera la RAM disponibile di un'istanza, selezionare un tipo di istanza diverso con memoria sufficiente per l'applicazione.
Le istanze Amazon EC2 Inf2
dispongono di un massimo di 16 chip AWS Inferentia e 100 Gbps di throughput di rete.
Per ulteriori informazioni sull'utilizzo di AWS Inferent Il chip AWS Inferentia con DLAMI
Argomento successivo
Istanze di Trainium consigliate