As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Depure os tensores de saída do modelo de trabalhos de treinamento de aprendizado de máquina em tempo real e detecte problemas não convergentes usando o Amazon Debugger. SageMaker
Recursos do Amazon SageMaker Debugger
Um trabalho de treinamento de machine learning (ML) pode ter problemas como sobreajuste, funções de ativação com saturação e gradientes que se diminuem, o que pode comprometer o desempenho do modelo.
SageMaker O Debugger fornece ferramentas para depurar trabalhos de treinamento e resolver esses problemas para melhorar o desempenho do seu modelo. O Depurador também oferece ferramentas para enviar alertas quando anomalias de treinamento são encontradas, executar ações contra os problemas e identificar a causa raiz deles por meio da visualização ao coletar métricas e tensores.
SageMaker O Debugger é compatível com as estruturas Apache MXNet,, PyTorch, e. TensorFlow XGBoost Para obter mais informações sobre estruturas e versões disponíveis suportadas pelo SageMaker Debugger, consulte. Algoritmos e frameworks compatíveis

O fluxo de trabalho de alto nível do Depurador é o seguinte:
-
Modifique seu script de treinamento com o SDK Python
sagemaker-debugger
, se necessário. -
Configure um trabalho SageMaker de treinamento com o SageMaker Debugger.
-
Configure usando a API SageMaker AI Estimator (para Python SDK).
-
Configure usando a
CreateTrainingJob
solicitação de SageMaker IA (para Boto3 ou CLI). -
Configure contêineres de treinamento personalizados com o SageMaker Debugger.
-
-
Inicie um trabalho de treinamento e monitore os problemas de treinamento em tempo real.
-
Seja alertado e tome medidas imediatas contra os problemas de treinamento.
-
Receba mensagens de texto e e-mails e interrompa os trabalhos de treinamento quando forem encontrados problemas de treinamento no uso de Usar ações integradas das regras do Depurador.
-
Configure suas próprias ações usando Amazon CloudWatch Events AWS Lambda e.
-
-
Explore uma análise profunda dos problemas de treinamento.
-
Para a depuração de tensores de saída do modelo, consulte Visualize os tensores de saída do depurador em TensorBoard.
-
-
Corrija os problemas, considere as sugestões fornecidas pelo Depurador e repita as etapas de 1 a 5 até otimizar seu modelo e atingir a precisão desejada.
O guia do desenvolvedor do SageMaker Debugger explica os tópicos a seguir.