Monitorando a saúde dos agentes do Kinesis Data Streams com a Amazon CloudWatch - Amazon Kinesis Data Streams

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitorando a saúde dos agentes do Kinesis Data Streams com a Amazon CloudWatch

O agente publica CloudWatch métricas personalizadas com um namespace de. AWS KinesisAgent Essas métricas ajudam você a avaliar se o agente está enviando dados ao Kinesis Data Streams conforme especificado, e se está íntegro e consumindo a quantidade apropriada de recursos de CPU e memória no produtor de dados. As métricas, como número de registros e bytes enviados, são úteis para compreender a taxa em que o agente está enviando dados ao stream. Quando essas métricas ficarem abaixo dos limites esperados em alguns percentuais ou caírem para zero, isso poderá indicar problemas de configuração, erros de rede ou problemas de integridade do agente. As métricas como consumo de CPU e memória no host e contadores de erros do agente indicam uso de recurso por parte do produtor de dados e fornece informações sobre erros potenciais de configuração ou de host. Por fim, o agente também registra exceções de serviço para ajudar a investigar problemas do agente. Essas métricas são reportadas na Região especificada na configuração de agente cloudwatch.endpoint. As métricas do Cloudwatch publicadas por vários agentes do Kinesis são agregadas ou combinadas. Para obter mais informações sobre a configuração do atendente, consulte Configurações do agente.

Monitoramento com CloudWatch

O agente do Kinesis Data Streams envia as seguintes métricas para o. CloudWatch

Métrica Descrição
BytesSent

O número de bytes enviados para o Kinesis Data Streams no período especificado.

Unidades: bytes

RecordSendAttempts

O número de tentativas de registro (primeira vez ou como nova tentativa) em uma chamada para PutRecords no período especificado.

Unidades: contagem

RecordSendErrors

O número de registros que retornaram status de falha em uma chamada para PutRecords, incluindo novas tentativas, no período especificado.

Unidades: contagem

ServiceErrors

O número de chamadas para PutRecords que resultaram em erro de serviço (diferente de um erro de controle de utilização) no período especificado.

Unidades: contagem