Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Paso 5. Ejecute la canalización

Este paso ejecuta la canalización de entrenamiento o inferencia que se creó en las AWS CloudFormation pilas en el paso 4. La canalización no se puede ejecutar hasta que sus parámetros de marcador de posición internos se hayan rellenado con valores concretos. Esta acción de asignar valores a los parámetros de los marcadores de posición es la actividad principal del paso 5. Algunos ejemplos de parámetros de marcador de posición son:
-
La ubicación de los conjuntos de datos de entrada, salida e intermedios
-
La ubicación en Amazon S3 de los scripts de tiempo de ejecución y otro código de preprocesamiento o evaluación que se desarrolló en el paso 2 (por ejemplo,
sm_submit_url
para el proceso de formación) -
El nombre de la región AWS
Debe asegurarse de que estos valores de trayectoria apuntan a datos o códigos válidos antes de ejecutar la canalización. Por ejemplo, si rellena el parámetro de marcador de posición que representa la URL de Amazon S3 de los scripts en tiempo de ejecución de Python, debe cargar esos scripts en esa URL. La persona que dirige la canalización es responsable de comprobar la coherencia y cargar los datos. Las personas que definen o crean la canalización no tienen que preocuparse por nada de esto.
En función de la madurez de la canalización, este paso puede automatizarse para que se ejecute de forma regular (semanal o mensual). La automatización también requiere una monitorización sólida, que es un área importante, pero queda fuera del alcance de estas recomendaciones. Para el proceso de entrenamiento, sería apropiado monitorizar las métricas de evaluación. Para la canalización de inferencia, sería apropiado monitorizar la desviación en la distribución de los datos de entrada y, si es posible, recopilar etiquetas periódicamente y medir la desviación en la precisión de la predicción. Estos registros de las series de entrenamiento e inferencia deben registrarse en una base de datos para analizarlos más adelante.