Ottieni immediatamente istanze potenziali - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Ottieni immediatamente istanze potenziali

Inference Recommender può anche fornirti un elenco di potenziali istanze, o tipi di istanze che potrebbero essere adatti al tuo modello, nella pagina dei dettagli del modello. SageMaker Il suggeritore di inferenza esegue automaticamente il benchmarking preliminare rispetto al modello per fornire le cinque istanze potenziali principali. Poiché si tratta di raccomandazioni preliminari, consigliamo di eseguire ulteriori processi di raccomandazione delle istanze per ottenere risultati più accurati.

Puoi visualizzare un elenco di potenziali istanze per il tuo modello a livello di codice utilizzando l'API DescribeModel, l'SDK SageMaker Python o la console. SageMaker

Nota

Non riceverai potenziali istanze per i modelli creati prima che questa funzionalità diventasse disponibile. SageMaker

Per visualizzare le istanze potenziali del modello tramite la console, effettua quanto segue:

  1. Vai alla SageMaker console all'indirizzo https://console.aws.amazon.com/sagemaker/.

  2. Nel riquadro di navigazione a sinistra, seleziona Inferenza e poi Moduli.

  3. Dall'elenco dei modelli, scegli il tuo modello.

Nella pagina dei dettagli del modello, vai alla sezione Istanze potenziali per implementare il modello. Lo screenshot seguente mostra questa sezione.

Screenshot dell'elenco delle istanze potenziali nella pagina dei dettagli del modello.

In questa sezione, è possibile visualizzare le potenziali istanze ottimizzate in termini di costi, throughput e latenza per l'implementazione del modello, insieme a informazioni aggiuntive per ogni tipo di istanza, come le dimensioni della memoria, il numero di CPU e GPU e il costo orario.

Se decidi di voler eseguire il benchmark di un payload di esempio ed eseguire un processo completo di raccomandazione di inferenza per il tuo modello, puoi avviare un processo di raccomandazione di inferenza predefinito da questa pagina. Per avviare un processo predefinito tramite la console, effettua quanto segue:

  1. Nella pagina dei dettagli del modello, nella sezione sulle istanze potenziali per implementare il modello, seleziona Avvia processo del suggeritore di inferenza.

  2. Nella finestra di dialogo che appare, per bucket S3 per l'esecuzione del benchmark del payload, inserisci la posizione Amazon S3 in cui hai archiviato un payload di esempio per il tuo modello.

  3. Per il tipo di contenuto di payload, inserisci i tipi MIME per i dati del payload.

  4. (Facoltativo) Nella sezione Compilazione del modello con SageMaker Neo, per la configurazione di input dei dati, inserisci una forma di dati in formato dizionario.

  5. Scegli Esegui processo.

Inference Recommender avvia il job ed è possibile visualizzare il job e i relativi risultati dalla pagina con l'elenco dei programmi di raccomandazione Inference nella console. SageMaker

Se desideri eseguire un processo avanzato ed eseguire test di carico personalizzati o se desideri configurare impostazioni e parametri aggiuntivi per il processo, consulta Esegui un test di carico personalizzato.