Istanze Inferentia consigliate

AWS Le istanze Inferentia sono progettate per fornire prestazioni elevate ed efficienza in termini di costi per i carichi di lavoro di inferenza dei modelli di deep learning. In particolare, i tipi di istanze Inf2 utilizzano i chip AWS Inferentia e l'SDK AWS Neuron, che è integrato con i più diffusi framework di apprendimento automatico come e. TensorFlow PyTorch

I clienti possono utilizzare le istanze Inf2 per eseguire applicazioni di inferenza di machine learning su larga scala come ricerca, motori di raccomandazione, visione artificiale, riconoscimento vocale, elaborazione del linguaggio naturale, personalizzazione e rilevamento delle frodi, al costo più basso del cloud.

Nota

La dimensione del modello dovrebbe essere un fattore nella scelta di un'istanza. Se il modello supera la RAM disponibile di un'istanza, scegli un tipo di istanza diverso con memoria sufficiente per l'applicazione.

Le istanze Amazon EC2 Inf2 hanno fino a 16 chip AWS Inferentia e 100 Gbps di throughput di rete.

Per ulteriori informazioni su come iniziare a usare Inferentia, consulta. AWS DLAMIs Il chip AWS Inferentia con DLAMI

Argomento successivo

Istanze Trainium consigliate

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

CPU

Trainium