Monitorar recursos da AWS no Amazon SageMaker AI - Amazon SageMaker AI

Monitorar recursos da AWS no Amazon SageMaker AI

O monitoramento é uma parte importante para manter a confiabilidade, a disponibilidade e o desempenho do SageMaker AI e das outras soluções da AWS. A AWS oferece as seguintes ferramentas de monitoramento para observar o SageMaker AO, informar quando algo está errado e realizar ações automaticamente quando apropriado:

  • O Amazon CloudWatch monitora os recursos da AWS e as aplicações que você executa na AWS em tempo real. Você pode coletar e rastrear métricas, criar painéis personalizados e definir alarmes que o notificam ou que realizam ações quando uma métrica especificada atinge um limite definido. Por exemplo, você pode fazer o CloudWatch acompanhar o uso da CPU ou outras métricas das instâncias do Amazon EC2 e iniciar automaticamente novas instâncias quando necessário. Para obter mais informações, consulte o Guia do usuário do Amazon CloudWatch.

  • O Amazon CloudWatch Logs permite monitorar, armazenar e acessar os arquivos de log de instâncias do EC2, do AWS CloudTrail e de outras fontes. O CloudWatch Logs pode monitorar informações nos arquivos de log e notificar você quando certos limites forem atingidos. É possível também arquivar seus dados de log em armazenamento resiliente. Para obter mais informações, consulte o Guia do usuário do Amazon CloudWatch Logs.

  • O AWS CloudTrail captura chamadas de API e eventos relacionados feitos por sua conta da AWS ou em nome dela e entrega os arquivos de log a um bucket do Amazon S3 especificado por você. Você pode identificar quais usuários e contas chamaram a AWS, o endereço IP de origem no qual as chamadas foram feitas e quando elas ocorreram. Para obter mais informações, consulte o Guia do usuário do AWS CloudTrail.

  • O CloudWatch Events oferece uma transmissão quase em tempo real de eventos do sistema que descrevem as mudanças nos recursos da AWS. Crie regras do CloudWatch que reajam a uma alteração em um treinamento do SageMaker AI, ajuste de hiperparâmetro ou trabalho de transformação em lote.