Guia de solução de problemas - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Guia de solução de problemas

Consulte este guia de solução de problemas para ajudá-lo a depurar falhas que podem ocorrer quando o trabalho programado do notebook é executado.

A definição de trabalho não cria trabalhos

Se sua definição de trabalho não iniciar nenhum trabalho, veja as seguintes possíveis causas:

Permissões ausentes

  • A função atribuída à definição do cargo não tem uma relação de confiança com a Amazon EventBridge. Ou seja, EventBridge não pode assumir o papel.

  • A função atribuída à definição de trabalho não tem permissão para chamar SageMaker:StartPipelineExecution.

  • A função atribuída à definição de trabalho não tem permissão para chamar SageMaker:CreateTrainingJob.

EventBridge cota excedida

Se você ver um Put* erro como o exemplo a seguir, você excedeu uma EventBridge cota. Para resolver isso, você pode limpar EventBridge execuções não utilizadas ou pedir AWS Support para aumentar sua cota.

LimitExceededException) when calling the PutRule operation: The requested resource exceeds the maximum number allowed

Para obter mais informações sobre EventBridge cotas, consulte EventBridge Cotas da Amazon.

Limite de cota de gasoduto excedido

Se você receber um erro como o exemplo a seguir, excedeu o número de pipelines que podem ser executados. Para resolver isso, você pode limpar os pipelines não utilizados na sua conta ou pedir AWS Support para aumentar sua cota.

ResourceLimitExceeded: The account-level service limit 'Maximum number of pipelines allowed per account' is XXX Pipelines, with current utilization of XXX Pipelines and a request delta of 1 Pipelines.

Para obter mais informações sobre cotas de pipeline, consulte SageMaker endpoints e cotas da Amazon.

Limite de trabalho de treinamento excedido

Se você ver um erro como o exemplo a seguir, você excedeu o número de trabalhos de treinamento que podem ser executados. Para resolver isso, reduza o número de vagas de treinamento em sua conta ou peça AWS Support para aumentar sua cota.

ResourceLimitExceeded: The account-level service limit 'ml.m5.2xlarge for training job usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances. Please contact AWS support to request an increase for this limit.

Para obter mais informações sobre cotas de trabalho de treinamento, consulte SageMaker endpoints e cotas da Amazon.

Visualizações automáticas desativadas em notebooks SparkMagic

Se o seu notebook usa o SparkMagic PySpark kernel e você executa o notebook como um Notebook Job, você pode ver que suas visualizações automáticas estão desativadas na saída. Ativar a visualização automática faz com que o kernel trave, então o executor de tarefas do notebook atualmente desativa as visualizações automáticas como uma solução alternativa.