Monitore a utilização de recursos AWS computacionais no Amazon Studio Classic SageMaker - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitore a utilização de recursos AWS computacionais no Amazon Studio Classic SageMaker

Para monitorar a utilização de recursos computacionais do seu trabalho de treinamento, use as ferramentas de monitoramento oferecidas pelo Amazon SageMaker Debugger.

Para qualquer trabalho de treinamento executado SageMaker usando o SDK do SageMaker Python, o Debugger coleta métricas básicas de utilização de recursos, como utilização da CPU, utilização da GPU, utilização da memória da GPU, rede e tempo de espera de E/S a cada 500 milissegundos. Para ver o painel das métricas de utilização de recursos do seu trabalho de treinamento, basta usar a interface do usuário do SageMaker Debugger no Studio Experiments. SageMaker

As operações e etapas de aprendizado profundo podem operar em intervalos de milissegundos. Em comparação com CloudWatch as métricas da Amazon, que coletam métricas em intervalos de 1 segundo, o Debugger fornece maior granularidade nas métricas de utilização de recursos em intervalos de até 100 milissegundos (0,1 segundo) para que você possa se aprofundar nas métricas no nível de uma operação ou etapa.

Se quiser alterar o intervalo de tempo de coleta de métricas, você pode adicionar um parâmetro para a configuração de criação de perfil ao seu inicializador de tarefas de treinamento. Por exemplo, se você estiver usando o SDK do SageMaker Python, precisará passar o profiler_config parâmetro ao criar um objeto estimador. Para saber como ajustar o intervalo de coleta da métrica de utilização de recursos, consulte Modelo de código para configurar um objeto SageMaker estimador com os módulos Debugger SageMaker Python no SDK do Python SageMaker e, depois, Defina as configurações para a criação de perfil básico da utilização dos recursos do sistema.

Além disso, você pode adicionar ferramentas de detecção de problemas chamadas regras de criação de perfil integradas fornecidas pelo SageMaker Debugger. As regras de criação de perfis integrados executam análises em relação às métricas de utilização de recursos e detectam problemas de desempenho computacional. Para ter mais informações, consulte Configure regras de criação de perfil integradas gerenciadas pelo Amazon SageMaker Debugger. Você pode receber os resultados da análise de regras por meio da interface do usuário do SageMaker Debugger no SageMaker Studio Experiments ou do SageMaker Debugger Profiling Report. Você também pode criar regras personalizadas de criação de perfil usando o SDK do SageMaker Python.

Para saber mais sobre as funcionalidades de monitoramento fornecidas pelo SageMaker Debugger, consulte os tópicos a seguir.