Fase 5. Esegui la pipeline - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Fase 5. Esegui la pipeline

Esecuzione della pipeline.

Questo passaggio esegue la pipeline di addestramento o inferenza creata negli AWS CloudFormation stack nel passaggio 4. La pipeline non può essere eseguita finché i parametri segnaposto interni non sono stati compilati con valori concreti. Questa azione di assegnazione di valori ai parametri segnaposto è l'attività principale della fase 5. I parametri segnaposto di esempio includono:

  • La posizione dei set di dati di input, output e intermedi

  • La posizione in Amazon S3 degli script di runtime e di altro codice di preelaborazione o valutazione sviluppato nella fase 2 (ad esempio, sm_submit_url per la pipeline di formazione)

  • Il nome della regione AWS

È necessario assicurarsi che questi valori di percorso puntino a dati o codice validi prima di eseguire la pipeline. Ad esempio, se compili il parametro placeholder che rappresenta l'URL Amazon S3 degli script di runtime Python, devi caricare quegli script su quell'URL. La persona che gestisce la pipeline è responsabile del controllo della coerenza e del caricamento dei dati. Le persone che definiscono o creano la pipeline non devono preoccuparsi di nulla di tutto ciò.

A seconda della maturità della pipeline, questo passaggio può essere automatizzato per essere eseguito su base regolare (settimanale o mensile). L'automazione richiede anche un monitoraggio affidabile, che è un'area importante ma non rientra nell'ambito di questa guida. Per lo svolgimento della pipeline di formazione, sarebbe opportuno monitorare le metriche di valutazione. Per quanto riguarda la pipeline di inferenza, sarebbe opportuno monitorare la deriva della distribuzione dei dati in ingresso e, se possibile, raccogliere periodicamente etichette e misurare la deriva nell'accuratezza della previsione. Questi record delle sessioni di addestramento e inferenza devono essere registrati in un database per essere analizzati in un secondo momento.