Descripción general de las canalizaciones - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Descripción general de las canalizaciones

Una SageMaker canalización de Amazon es una serie de pasos interconectados en un grafo acíclico dirigido (DAG) que se definen mediante la drag-and-drop interfaz de usuario o SDKPipelines. También puede crear su canalización utilizando el esquema de definición JSON de canalización. Esta DAG JSON definición proporciona información sobre los requisitos y las relaciones entre cada paso de tu canalización. La estructura de una canalización DAG viene determinada por las dependencias de datos entre los pasos. Estas dependencias de datos se crean cuando las propiedades de la salida de un paso se transfieren como entrada a otro paso. La siguiente imagen es un ejemplo de una canalizaciónDAG:

Un ejemplo de gráfico acíclico dirigido a una canalización (DAG).
El ejemplo DAG incluye los siguientes pasos:
  1. AbaloneProcess, una instancia del paso de procesamiento, ejecuta un script de preprocesamiento con los datos utilizados para el entrenamiento. Por ejemplo, el script podría rellenar los valores faltantes, normalizar los datos numéricos o dividir los datos en los conjuntos de datos de tren, validación y prueba.

  2. AbaloneTrain, una instancia del paso de entrenamiento, configura los hiperparámetros y entrena un modelo a partir de los datos de entrada preprocesados.

  3. AbaloneEval, otra instancia del paso de procesamiento, evalúa la precisión del modelo. En este paso se muestra un ejemplo de una dependencia de datos: en este paso se utiliza la salida del conjunto de datos de prueba del. AbaloneProcess

  4. AbaloneMSECondes una instancia de un paso de condición que, en este ejemplo, comprueba que el mean-square-error resultado de la evaluación del modelo esté por debajo de un límite determinado. Si el modelo no cumple los criterios, el recorrido de la tubería se detiene.

  5. El recorrido de la tubería continúa con los siguientes pasos:

    1. AbaloneRegisterModel, donde se SageMaker solicita un RegisterModelpaso para registrar el modelo como un grupo de paquetes de modelos versionados en el Registro de SageMaker modelos de Amazon.

    2. AbaloneCreateModel, donde se SageMaker indica un CreateModelpaso para crear el modelo como preparación para la transformación por lotes. EnAbaloneTransform, SageMaker invoca un paso de transformación para generar predicciones del modelo en un conjunto de datos que especifique.

En los siguientes temas se describen los conceptos fundamentales de Pipelines. Para ver un tutorial que describe la implementación de estos conceptos, consulte Canaliza las acciones.