Rastree el linaje de una canalización de aprendizaje SageMaker automático - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Rastree el linaje de una canalización de aprendizaje SageMaker automático

En este tutorial, utilizará Amazon SageMaker Studio para realizar un seguimiento del linaje de una canalización de Amazon SageMaker ML.

La canalización se creó con el cuaderno Orchestrating Jobs with Amazon SageMaker Model Building Pipelines en el repositorio de SageMaker ejemplos GitHub de Amazon. Para obtener información detallada sobre cómo se creó la canalización, consulte Defina una canalización de creación de modelos.

El seguimiento del linaje de Studio se centra en torno a un gráfico acíclico dirigido (DAG). El DAG representa los pasos de la canalización. Desde el DAG, es posible realizar un seguimiento del linaje desde cualquier paso hasta cualquier otro paso. En el siguiente diagrama se muestran los pasos de la canalización. Estos pasos aparecen como un DAG en Studio.

Un diagrama de los pasos de un flujo de trabajo de canalización.

Para realizar un seguimiento del linaje de una canalización en la consola de Amazon SageMaker Studio, complete los siguientes pasos en función de si utiliza Studio o Studio Classic.

Studio
Para hacer el seguimiento del linaje de una canalización
  1. Abre la consola de SageMaker Studio siguiendo las instrucciones de Launch Amazon SageMaker Studio.

  2. En el panel de navegación izquierdo, selecciona Pipelines.

  3. (Opcional) Para filtrar la lista de tuberías por nombre, introduzca un nombre de tubería completo o parcial en el campo de búsqueda.

  4. En la columna Nombre, seleccione un nombre de tubería para ver los detalles de la tubería. Se abre la página de ejecuciones de la canalización y muestra una lista de las ejecuciones de la canalización.

  5. En la columna Nombre de la tabla Ejecuciones, seleccione el nombre de la ejecución de la canalización que desee ver.

  6. En la parte superior derecha de la página de ejecuciones, selecciona los puntos suspensivos verticales y selecciona Descargar la definición de canalización (JSON). Puede ver el archivo para ver cómo se definió el gráfico de la canalización.

  7. Utilice los iconos de cambio de tamaño de la parte inferior derecha del gráfico para acercar y alejar el gráfico, ajustarlo a la pantalla o ampliarlo a pantalla completa. Para centrarse en una parte específica del gráfico, puede seleccionar un área en blanco del gráfico y arrastrar el gráfico para centrarlo en esa área. El recuadro de la parte inferior derecha del gráfico muestra el lugar donde se encuentra en el gráfico.

    La siguiente imagen muestra un ejemplo de gráfico de canalización con iconos insertados y de cambio de tamaño. Además, las pestañas situadas a la derecha del gráfico contienen información detallada sobre la ejecución de la canalización.

    Un gráfico de canalización y pestañas que muestran los detalles de los pasos.
  8. Para ver tus conjuntos de datos de entrenamiento, validación y prueba, sigue estos pasos:

    1. Elige el paso de procesamiento en el gráfico de tu canalización.

    2. En la pestaña Descripción general, en la sección Archivos, busque las rutas de Amazon S3 a los conjuntos de datos de entrenamiento, validación y prueba.

  9. Para ver los artefactos del modelo, complete los siguientes pasos:

    1. Elija el paso de formación en el gráfico de su proceso.

    2. En la pestaña Descripción general, en la sección Archivos, busque las rutas de Amazon S3 al artefacto modelo.

  10. Para encontrar el ARN del paquete modelo, complete los siguientes pasos:

    1. Elija el paso de registro del modelo (RegisterModel).

    2. En la pestaña Descripción general, en la sección Archivos, busque el ARN del paquete del modelo.

Studio Classic
Para hacer el seguimiento del linaje de una canalización
  1. Inicia sesión en Amazon SageMaker Studio Classic. Para obtener más información, consulte Lanzamiento de Amazon SageMaker Studio Classic.

  2. En la barra lateral de la izquierda de Studio, elija el icono de Inicio ( ).

  3. En el menú, seleccione Canalizaciones.

  4. Puede utilizar el cuadro Búsqueda para filtrar la lista de canalizaciones.

  5. Elija la AbalonePipeline canalización para ver la lista de ejecuciones y otros detalles sobre la canalización.

  6. Elija el icono de Inspector de propiedades ( ) en la barra lateral derecha para abrir el panel PROPIEDADES DE LA TABLA, donde puede elegir qué propiedades desea ver.

  7. Elija la pestaña Configuración y, a continuación, elija Descargar el archivo de definición de la canalización. Puede ver el archivo para ver cómo se definió el gráfico de la canalización.

  8. En la pestaña Ejecución, seleccione la primera fila de la lista de ejecuciones para ver su gráfico de ejecución y otros detalles sobre la ejecución. Tenga en cuenta que el gráfico coincide con el diagrama que se muestra al principio del tutorial.

    Utilice los iconos de cambio de tamaño de la parte inferior derecha del gráfico para acercarlo y alejarlo, ajustarlo a la pantalla o ampliarlo a pantalla completa. Para centrarse en una parte específica del gráfico, puede seleccionar un área en blanco del gráfico y arrastrar el gráfico para centrarlo en esa área. El recuadro de la parte inferior derecha del gráfico muestra el lugar donde se encuentra en el gráfico.

    El DAG de canalización.
  9. En la pestaña Gráfico, elija el paso AbaloneProcess para ver los detalles del paso.

  10. Busque las rutas de Amazon S3 a los conjuntos de datos de entrenamiento, validación y prueba en la pestaña Salida, en Archivos.

    nota

    Para obtener las rutas completas, haga clic con el botón derecho en la ruta y, a continuación, elija Copiar el contenido de la celda.

    s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/train s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/validation s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/test
  11. Elija el paso AbaloneTrain.

  12. Busque la ruta de Amazon S3 al artefacto del modelo en la pestaña Salida, en Archivos:

    s3://sagemaker-eu-west-1-acct-id/AbaloneTrain/pipelines-6locnsqz4bfu-AbaloneTrain-NtfEpI0Ahu/output/model.tar.gz
  13. Elija el paso AbaloneRegisterModel.

  14. Busque el ARN del paquete de modelos en la pestaña Salida, en Archivos:

    arn:aws:sagemaker:eu-west-1:acct-id:model-package/abalonemodelpackagegroupname/2