Fase 5: Esegui la pipeline - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Fase 5: Esegui la pipeline


   Esegui la pipeline.

Questo passaggio esegue la pipeline di addestramento o inferenza creata nelAWS CloudFormationsi impilano nella fase 4. La pipeline non può essere eseguita fino a quando i parametri del segnaposto interno non sono stati compilati con valori concreti. Questa azione di assegnazione di valori ai parametri segnaposto è l'attività principale del passaggio 5. I parametri segnaposto di esempio includono:

  • La posizione dei set di dati di input, output e intermedi

  • La posizione di Amazon S3 degli script di runtime e altri codici di preelaborazione o valutazione sviluppati nel passaggio 2 (ad esempio,sm_submit_urlper la pipeline di formazione)

  • Il nome dellaAWSRegion

È necessario assicurarsi che questi valori di percorso puntino a dati o codice validi prima di eseguire la pipeline. Ad esempio, se si inserisce il parametro segnaposto che rappresenta l'URL Amazon S3 degli script runtime Python, è necessario caricare tali script su tale URL. La persona che gestisce la pipeline è responsabile del controllo della coerenza e del caricamento dei dati. Le persone che definiscono o creano la pipeline non devono preoccuparsi di tutto questo.

A seconda della scadenza della pipeline, questo passaggio può essere automatizzato per funzionare regolarmente (settimanalmente o mensilmente). L'automazione richiede anche un monitoraggio solido, che è un'area importante ma non rientra nell'ambito di questa guida. Per l'esecuzione della pipeline di formazione, sarebbe opportuno monitorare le metriche di valutazione. Per la pipeline di inferenza, sarebbe opportuno monitorare la deriva della distribuzione dei dati di input e, se possibile, raccogliere periodicamente le etichette e misurare la deriva nell'accuratezza delle previsioni. Questi record provenienti dalle esecuzioni di addestramento e inferenza devono essere registrati in un database per l'analisi in un secondo momento.