Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Étape 5. Exécutez le pipeline

Cette étape exécute le pipeline d'entraînement ou d'inférence créé dans les AWS CloudFormation piles à l'étape 4. Le pipeline ne peut pas être exécuté tant que ses paramètres d'espace réservé internes n'ont pas été remplis avec des valeurs concrètes. Cette action consistant à attribuer des valeurs aux paramètres d'espace réservé est l'activité principale de l'étape 5. Voici quelques exemples de paramètres d'espace réservé :
-
Emplacement des ensembles de données d'entrée, de sortie et intermédiaires
-
L'emplacement Amazon S3 des scripts d'exécution et des autres codes de prétraitement ou d'évaluation développés à l'étape 2 (par exemple,
sm_submit_url
pour le pipeline de formation) -
Le nom de la AWS région
Vous devez vous assurer que ces valeurs de chemin pointent vers des données ou du code valides avant d'exécuter le pipeline. Par exemple, si vous renseignez le paramètre d'espace réservé qui représente l'URL Amazon S3 des scripts d'exécution Python, vous devez télécharger ces scripts sur cette URL. La personne qui gère le pipeline est responsable du contrôle de cohérence et du téléchargement des données. Les personnes qui définissent ou créent le pipeline n'ont pas à s'inquiéter de tout cela.
En fonction de la maturité du pipeline, cette étape peut être automatisée pour s'exécuter régulièrement (chaque semaine ou chaque mois). L'automatisation nécessite également une surveillance robuste, un domaine important mais qui n'entre pas dans le cadre de ce guide. Pour le déroulement du pipeline de formation, il serait approprié de surveiller les indicateurs d'évaluation. Pour le pipeline d'inférence, il serait approprié de surveiller la dérive de distribution des données d'entrée et, si possible, de collecter des étiquettes périodiquement et de mesurer la dérive de la précision des prédictions. Ces enregistrements des cycles d'entraînement et d'inférence doivent être enregistrés dans une base de données pour être analysés ultérieurement.