Rastreie a linhagem de um pipeline de SageMaker ML - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Rastreie a linhagem de um pipeline de SageMaker ML

Neste tutorial, você usa o Amazon SageMaker Studio para rastrear a linhagem de um pipeline do Amazon SageMaker ML.

O pipeline foi criado pelo notebook Orchestrating Jobs with Amazon SageMaker Model Building Pipelines no repositório de exemplos da Amazon SageMaker . GitHub Para obter informações detalhadas sobre como o pipeline foi criado, consulte Defina um pipeline de construção de modelos.

O rastreamento de linhagem no Studio é centrado em torno de um gráfico acíclico dirigido (DAG). O DAG representa as etapas em um pipeline. No DAG, você pode rastrear a linhagem de qualquer etapa para qualquer outra etapa. O diagrama a seguir mostra as etapas do pipeline. Essas etapas aparecem como um DAG no Studio.

Um diagrama das etapas de um fluxo de trabalho de pipeline.

Para rastrear a linhagem de um pipeline no console do Amazon SageMaker Studio, conclua as etapas a seguir com base no uso do Studio ou do Studio Classic.

Studio
Para rastrear a linhagem de um pipeline
  1. Abra o console do SageMaker Studio seguindo as instruções em Iniciar o Amazon SageMaker Studio.

  2. No painel de navegação esquerdo, selecione Pipelines.

  3. (Opcional) Para filtrar a lista de pipelines por nome, insira um nome completo ou parcial do pipeline no campo de pesquisa.

  4. Na coluna Nome, selecione um nome de pipeline para ver detalhes sobre o pipeline. A página Execuções do pipeline é aberta e exibe uma lista das execuções do pipeline.

  5. Na coluna Nome da tabela Execuções, selecione o nome de uma execução de pipeline a ser visualizada.

  6. No canto superior direito da página Execuções, escolha a elipse vertical e escolha Download pipeline definition (JSON). Você pode visualizar o arquivo para ver como o gráfico do pipeline foi definido.

  7. Use os ícones de redimensionamento no lado inferior direito do gráfico para ampliar e reduzir o gráfico, ajustar o gráfico à tela ou expandir o gráfico para tela cheia. Para focar em uma parte específica do gráfico, você pode selecionar uma área em branco do gráfico e arrastar o gráfico para centralizar nessa área. A inserção no lado inferior direito do gráfico mostra o local do gráfico.

    A imagem a seguir mostra um exemplo de gráfico de pipeline com ícones de inserção e redimensionamento. Além disso, as guias à direita do gráfico contêm informações detalhadas sobre a execução do seu pipeline.

    Um gráfico do pipeline e guias mostrando os detalhes das etapas.
  8. Para visualizar seus conjuntos de dados de treinamento, validação e teste, conclua as seguintes etapas:

    1. Escolha a etapa de processamento no gráfico do pipeline.

    2. Na guia Visão geral, na seção Arquivos, encontre os caminhos do Amazon S3 para os conjuntos de dados de treinamento, validação e teste.

  9. Para visualizar os artefatos do seu modelo, conclua as seguintes etapas:

    1. Escolha a etapa de treinamento no gráfico do seu pipeline.

    2. Na guia Visão geral, na seção Arquivos, encontre os caminhos do Amazon S3 para o artefato do modelo.

  10. Para encontrar o ARN do pacote de modelos, conclua as seguintes etapas:

    1. Escolha a etapa de registro do modelo (RegisterModel).

    2. Na guia Visão geral, na seção Arquivos, localize o ARN do pacote do modelo.

Studio Classic
Para rastrear a linhagem de um pipeline
  1. Faça login no Amazon SageMaker Studio Classic. Para obter mais informações, consulte Launch Amazon SageMaker Studio Classic.

  2. Na barra lateral esquerda do Studio, escolha o ícone Início ( ).

  3. No menu, selecione Pipelines.

  4. Use a caixa de Pesquisa para filtrar a lista de pipelines.

  5. Escolha o AbalonePipeline pipeline para ver a lista de execução e outros detalhes sobre o pipeline.

  6. Escolha o ícone do Inspetor de propriedades ( ) na barra lateral direita para abrir o painel PROPRIEDADES DA TABELA, onde você pode escolher quais propriedades exibir.

  7. Escolha a aba Configurações e, em seguida, escolha Baixar arquivo de definição de pipeline. Você pode visualizar o arquivo para ver como o gráfico do pipeline foi definido.

  8. Na guia Execução, selecione a primeira linha na lista de execução para visualizar seu gráfico de execução e outros detalhes sobre a execução. Observe que o gráfico corresponde ao diagrama exibido no início do tutorial.

    Use os ícones de redimensionamento no lado inferior direito do gráfico para ampliar e reduzir o gráfico, ajustar o gráfico à tela ou expandir o gráfico para tela cheia. Para focar em uma parte específica do gráfico, você pode selecionar uma área em branco do gráfico e arrastar o gráfico para centralizar nessa área. A inserção no lado inferior direito do gráfico mostra o local do gráfico.

    O pipeline DAG.
  9. Na aba Gráfico, escolha a etapa AbaloneProcess para visualizar detalhes sobre ela.

  10. Encontre os caminhos do Amazon S3 para os conjuntos de dados de treinamento, validação e teste na aba Saída, em Arquivos.

    nota

    Para obter os caminhos completos, clique com o botão direito do mouse no caminho e escolha Copiar conteúdo da célula.

    s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/train s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/validation s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/test
  11. Escolha a etapa AbaloneTrain.

  12. Encontre o caminho do Amazon S3 para o artefato do modelo na aba Saída, em Arquivos:

    s3://sagemaker-eu-west-1-acct-id/AbaloneTrain/pipelines-6locnsqz4bfu-AbaloneTrain-NtfEpI0Ahu/output/model.tar.gz
  13. Escolha a etapa AbaloneRegisterModel.

  14. Encontre o ARN do pacote do modelo na aba Saída, em Arquivos:

    arn:aws:sagemaker:eu-west-1:acct-id:model-package/abalonemodelpackagegroupname/2