Costi per l'utilizzo di Amazon Redshift ML - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Costi per l'utilizzo di Amazon Redshift ML

Amazon Redshift ML utilizza le risorse cluster esistenti per la previsione in modo da evitare ulteriori addebiti Amazon Redshift. Non sono previsti costi aggiuntivi Amazon Redshift per la creazione o l'utilizzo di un modello. La previsione avviene localmente nel cluster Redshift, quindi non è necessario pagare extra a meno che non sia necessario ridimensionare il cluster. Amazon Redshift ML utilizza Amazon SageMaker per addestrare il tuo modello, il che comporta un costo aggiuntivo associato.

Le funzioni di previsione eseguite all'interno del cluster Amazon Redshift non comportano costi supplementari. L'istruzione CREATE MODEL utilizza Amazon SageMaker e comporta un costo aggiuntivo. Il costo aumenta con il numero di celle nei dati di addestramento. Il numero di celle è il prodotto del numero di record (nella query di addestramento o nelle ore di tabella) moltiplicato per il numero di colonne. Ad esempio, quando una query SELECT dell'istruzione CREATE MODEL crea 10.000 record e 5 colonne, il numero di celle create è 50.000.

In alcuni casi, i dati di addestramento prodotti dalla query SELECT di CREATE MODEL superano il limite MAX_CELLS fornito (o il valore predefinito di 1 milione se non è stato impostato un limite). In questi casi, CREATE MODEL sceglie casualmente circa MAX_CELLS (cioè il "numero di colonne" record dal set di dati di addestramento). CREATE MODEL quindi esegue la formazione utilizzando queste tuple scelte casualmente. Il campionamento casuale assicura che il set di dati di addestramento ridotto non abbia alcun errore. Pertanto, impostando MAX_CELLS, è possibile controllare i costi di addestramento.

Quando si utilizza l'istruzione CREATE MODEL, è possibile utilizzare le opzioni MAX_CELLS e MAX_RUNTIME per controllare i costi, il tempo e la precisione potenziale del modello.

MAX_RUNTIME specifica la quantità massima di tempo che la formazione può impiegare SageMaker quando viene utilizzata l'opzione AUTO ON o OFF. I processi di addestramento spesso vengono completati prima di MAX_RUNTIME, in base alle dimensioni del set di dati. Dopo aver addestrato un modello, Amazon Redshift esegue ulteriori lavori in background per compilare e installare i modelli nel cluster. Pertanto, il completamento di CREATE MODEL può richiedere più tempo di MAX_RUNTIME. Tuttavia, MAX_RUNTIME limita la quantità di calcolo e il tempo utilizzati per addestrare il modello. SageMaker È possibile controllare lo stato del modello in qualsiasi momento utilizzando SHOW MODEL.

Quando esegui CREATE MODEL con AUTO ON, Amazon Redshift ML utilizza SageMaker Autopilot per esplorare in modo automatico e intelligente diversi modelli (o candidati) per trovare quello migliore. MAX_RUNTIME limita la quantità di tempo e calcolo impiegato. Se MAX_RUNTIME è impostato su un valore troppo basso, potrebbe non esserci abbastanza tempo per esplorare neanche un candidato. Se viene visualizzato l'errore "Il candidato pilota automatico non ha modelli", eseguire di nuovo CREATE MODEL con un valore maggiore di MAX_RUNTIME. Per ulteriori informazioni su questo parametro, consulta MaxAutoML JobRuntimeInSeconds nell'Amazon SageMaker API Reference.

Quando esegui CREATE MODEL con AUTO OFF, MAX_RUNTIME corrisponde a un limite per la durata dell'esecuzione del processo di formazione. SageMaker I processi di addestramento vengono spesso completati prima, a seconda delle dimensioni del set di dati e di altri parametri utilizzati, ad esempio num_rounds in MODEL_TYPE XGBOOST.

È inoltre possibile controllare i costi o ridurre i tempi di addestramento specificando un valore MAX_CELLS più piccolo quando si esegue CREATE MODEL. Una cella è una voce nel database. Ogni riga corrisponde a tutte le celle quante sono le colonne, che possono essere di larghezza fissa o variabile. MAX_CELLS limita il numero di celle e quindi il numero di esempi di addestramento utilizzati per addestrare il modello. Per impostazione predefinita, MAX_CELLS è impostato su 1 milione di celle. La riduzione di MAX_CELLS riduce il numero di righe dal risultato della query SELECT in CREATE MODEL che Amazon Redshift esporta e invia SageMaker per addestrare un modello. La riduzione di MAX_CELLS riduce così la dimensione del set di dati utilizzato per addestrare i modelli sia con AUTO ON che con AUTO OFF. Questo approccio aiuta a ridurre i costi e i tempi di addestramento dei modelli. Per visualizzare informazioni sulla formazione e sui tempi di fatturazione di uno specifico lavoro di formazione, scegli Lavori di formazione in Amazon SageMaker.

L'aumento di MAX_RUNTIME e MAX_CELLS spesso migliora la qualità del modello consentendo SageMaker di esplorare più candidati. In questo modo, SageMaker può richiedere più tempo per addestrare ciascun candidato e utilizzare più dati per addestrare modelli migliori. Se si desidera un'iterazione o un'esplorazione del set di dati più rapida, utilizzare valori più bassi per MAX_RUNTIME e MAX_CELLS. Se si desidera una maggiore precisione dei modelli, utilizzare valori maggiori per MAX_RUNTIME e MAX_CELLS.

Per ulteriori informazioni sui costi associati a vari numeri di cellulare e i dettagli della versione di prova gratuita, consultare Prezzi di Amazon Redshift.