As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
A essência do treinamento de modelos de aprendizado de máquina, redes neurais de aprendizado profundo e modelos de transformadores está em alcançar uma convergência estável de modelos e, como tal, state-of-the-art os modelos têm milhões, bilhões ou trilhões de parâmetros de modelo. O número de operações para atualizar o número gigantesco de parâmetros do modelo durante cada iteração pode facilmente se tornar astronômico. Para identificar problemas de convergência do modelo, é importante poder acessar os parâmetros, ativações e gradientes do modelo calculados durante os processos de otimização.
A Amazon SageMaker AI fornece duas ferramentas de depuração para ajudar a identificar esses problemas de convergência e obter visibilidade de seus modelos.
Amazon SageMaker AI com TensorBoard
Para oferecer uma maior compatibilidade com as ferramentas comunitárias de código aberto na plataforma de treinamento de SageMaker IA, a SageMaker IA hospeda TensorBoard como um aplicativo no SageMaker domínio da IA. Você pode trazer seus trabalhos de treinamento para a SageMaker IA e continuar usando o redator de TensorBoard resumos para coletar os tensores de saída do modelo. Como TensorBoard é implementado no domínio de SageMaker IA, ele também oferece mais opções para gerenciar perfis de usuário no domínio de SageMaker IA em sua AWS conta e fornece um controle preciso sobre os perfis de usuário ao conceder acesso a ações e recursos específicos. Para saber mais, consulte TensorBoard na Amazon SageMaker AI.
SageMaker Depurador Amazon
O Amazon SageMaker Debugger é um recurso de SageMaker IA que fornece ferramentas para registrar ganchos em retornos de chamada para extrair tensores de saída do modelo e salvá-los no Amazon Simple Storage Service. Ele fornece regras integradas para detectar problemas de convergência de modelos, como sobreajuste, funções de ativação saturadas, gradientes desaparecendo e muito mais. Você também pode configurar as regras integradas com o Amazon CloudWatch Events e AWS Lambda realizar ações automatizadas contra problemas detectados, além de configurar o Amazon Simple Notification Service para receber notificações por e-mail ou texto. Para saber mais, consulte SageMaker Depurador Amazon.