Note per l'utilizzo - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuovi Python a UDFs partire dal 1° novembre 2025. Se vuoi usare Python UDFs, crea la UDFs data precedente a quella data. Python esistente UDFs continuerà a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Note per l'utilizzo

Durante l'utilizzo di CREATE MODEL, considerare quanto segue:

  • L'istruzione CREATE MODEL opera in modalità asincrona e restituisce i risultati al momento dell'esportazione dei dati di addestramento in Amazon S3. Le fasi rimanenti della formazione in Amazon SageMaker AI avvengono in background. Mentre l'addestramento è in corso, la funzione di inferenza corrispondente è visibile ma non può essere eseguita. È possibile eseguire query su STV_ML_MODEL_INFO per visualizzare lo stato dell'addestramento.

  • L'addestramento può durare fino a 90 minuti in background, per impostazione predefinita nel modello Auto e può essere esteso. Per annullare l'addestramento, è sufficiente eseguire il comando DROP MODEL.

  • Il cluster Amazon Redshift che si utilizza per creare il modello e il bucket Amazon S3 utilizzato per mettere in scena i dati di addestramento e gli artefatti del modello devono trovarsi nella stessa regione AWS .

  • Durante la formazione del modello, Amazon Redshift e SageMaker AI archiviano artefatti intermedi nel bucket Amazon S3 che fornisci. Per impostazione predefinita, Amazon Redshift esegue la garbage collection alla fine dell'operazione CREATE MODEL. Amazon Redshift rimuove gli oggetti da Amazon S3. Per conservare questi artefatti in Amazon S3, impostare l'opzione S3_GARBAGE COLLECT OFF.

  • È necessario utilizzare almeno 500 righe nei dati di addestramento forniti nella clausola FROM.

  • Quando si utilizza l'istruzione CREATE MODEL, è possibile specificare fino a 256 colonne di funzionalità (input) nella clausola FROM { table_name | (select_query) }.

  • Per AUTO ON, i tipi di colonna che è possibile utilizzare come set di addestramento sono SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE, BOOLEAN, CHAR, VARCHAR, DATE, TIME, TIMETZ, TIMESTAMP e TIMESTAMPTZ. Per AUTO OFF, i tipi di colonna che è possibile utilizzare come set di addestramento sono SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE e BOOLEAN.

  • Non è possibile utilizzare DECIMAL, DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ, GEOMETRY, GEOGRAPHY HLLSKETCH, SUPER o VARBYTE come tipo di colonna di destinazione.

  • Per migliorare la precisione del modello, procedere in uno dei seguenti modi:

    • Aggiungere il maggior numero possibile di colonne rilevanti nel comando CREATE MODEL quando si specificano i dati di addestramento nella clausola FROM.

    • Utilizzare un valore maggiore per MAX_RUNTIVE e MAX_CELLS. Valori maggiori per questo parametro aumentano il costo di addestramento di un modello.

  • L'esecuzione dell'istruzione CREATE MODEL viene restituita non appena i dati di addestramento vengono calcolati ed esportati nel bucket Amazon S3. Dopo questo punto, è possibile controllare lo stato dell'addestramento utilizzando il comando SHOW MODEL. Quando un modello addestrato in background non riesce, è possibile controllare l'errore utilizzando SHOW MODEL. Non è possibile riprovare un modello non riuscito. Utilizzare DROP MODEL per rimuovere un modello non riuscito e crearne uno nuovo. Per ulteriori informazioni su SHOW MODEL, consultare SHOW MODEL.

  • Il BYOM locale supporta lo stesso tipo di modelli supportati da Amazon Redshift ML per i casi non BYOM. Amazon Redshift supporta modelli semplici XGBoost (utilizzando la XGBoost versione 1.0 o successiva), KMEANS senza preprocessori e modelli XGBOOST/MLP/Linear Learner addestrati da Amazon AI Autopilot. SageMaker Supporta quest'ultimo con preprocessori specificati da Autopilot che sono supportati anche da Amazon AI Neo. SageMaker

  • Se il tuo cluster Amazon Redshift ha un routing avanzato abilitato per il tuo cloud privato virtuale (VPC), assicurati di creare un endpoint VPC Amazon S3 e un endpoint VPC AI SageMaker per il VPC in cui si trova il cluster. Ciò fa sì che il traffico possa essere eseguito attraverso il VPC tra i servizi durante CREATE MODEL. Per ulteriori informazioni, consulta SageMaker AI Clarify Job Amazon VPC, sottoreti e gruppi di sicurezza.