Ottieni immediatamente istanze potenziali

Inference Recommender può anche fornirti un elenco di potenziali istanze, o tipi di istanze che potrebbero essere adatti al tuo modello, nella pagina dei dettagli del tuo modello di intelligenza artificiale. SageMaker Il suggeritore di inferenza esegue automaticamente il benchmarking preliminare rispetto al modello per fornire le cinque istanze potenziali principali. Poiché si tratta di raccomandazioni preliminari, consigliamo di eseguire ulteriori processi di raccomandazione delle istanze per ottenere risultati più accurati.

Puoi visualizzare un elenco di potenziali istanze per il tuo modello a livello di codice utilizzando l'API DescribeModel, l'SDK SageMaker Python o la console AI. SageMaker

Nota

Non riceverai potenziali istanze per i modelli che hai creato in AI prima che questa funzionalità diventasse disponibile. SageMaker

Per visualizzare le istanze potenziali del modello tramite la console, effettua quanto segue:

Vai alla SageMaker console all'indirizzo. https://console.aws.amazon.com/sagemaker/
Nel riquadro di navigazione a sinistra, seleziona Inferenza e poi Moduli.
Dall'elenco dei modelli, scegli il tuo modello.

Nella pagina dei dettagli del modello, vai alla sezione Istanze potenziali per implementare il modello. Lo screenshot seguente mostra questa sezione.

Screenshot dell'elenco delle istanze potenziali nella pagina dei dettagli del modello.

In questa sezione, è possibile visualizzare le potenziali istanze ottimizzate in termini di costi, throughput e latenza per l'implementazione del modello, insieme a informazioni aggiuntive per ogni tipo di istanza, come le dimensioni della memoria, il numero di CPU e GPU e il costo orario.

Se decidi di voler eseguire il benchmark di un payload di esempio ed eseguire un processo completo di raccomandazione di inferenza per il tuo modello, puoi avviare un processo di raccomandazione di inferenza predefinito da questa pagina. Per avviare un processo predefinito tramite la console, effettua quanto segue:

Nella pagina dei dettagli del modello, nella sezione sulle istanze potenziali per implementare il modello, seleziona Avvia processo del suggeritore di inferenza.
Nella finestra di dialogo che appare, per bucket S3 per l'esecuzione del benchmark del payload, inserisci la posizione Amazon S3 in cui hai archiviato un payload di esempio per il tuo modello.
Per il tipo di contenuto di payload, inserisci i tipi MIME per i dati del payload.
(Facoltativo) Nella sezione Compilazione del modello con SageMaker Neo, per la configurazione di input dei dati, inserisci una forma di dati in formato dizionario.
Scegli Esegui processo.

Inference Recommender avvia il lavoro e puoi visualizzare il lavoro e i relativi risultati dalla pagina dell'elenco dei consigliatori di Inference nella console AI. SageMaker

Se desideri eseguire un processo avanzato ed eseguire test di carico personalizzati o se desideri configurare impostazioni e parametri aggiuntivi per il processo, consulta Esegui un test di carico personalizzato.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Processi di raccomandazione

Raccomandazioni di inferenza