Erro de compilação com o construtor LeaseManagementConfig Alguns registros do Kinesis Data Streams são ignorados quando a Kinesis Client Library é usada Registros pertencentes ao mesmo fragmento são processados por processadores de registros diferentes ao mesmo tempo O aplicativo consumidor está lendo a uma taxa menor que a esperada GetRecords retorna uma matriz de registros vazia mesmo quando há dados no fluxo O iterador de fragmentos expira inesperadamente Processamento de registros de consumidores ficando atrasados Erro de permissão de chave KMS não autorizada DynamoDbException: o caminho do documento fornecido na expressão de atualização é inválido para atualização Solucionar outros problemas comuns para consumidores

Solução de problemas de consumidores do Kinesis Data Streams

Os tópicos a seguir oferecem soluções para problemas comuns com consumidores do Amazon Kinesis Data Streams:

Erro de compilação com o construtor LeaseManagementConfig
Alguns registros do Kinesis Data Streams são ignorados quando a Kinesis Client Library é usada
Registros pertencentes ao mesmo fragmento são processados por processadores de registros diferentes ao mesmo tempo
O aplicativo consumidor está lendo a uma taxa menor que a esperada
GetRecords retorna uma matriz de registros vazia mesmo quando há dados no fluxo
O iterador de fragmentos expira inesperadamente
Processamento de registros de consumidores ficando atrasados
Erro de permissão de chave KMS não autorizada
DynamoDbException: o caminho do documento fornecido na expressão de atualização é inválido para atualização
Solucionar outros problemas comuns para consumidores

Erro de compilação com o construtor LeaseManagementConfig

Ao fazer o upgrade para a Kinesis Client Library (KCL) versão 3.x ou posterior, você pode encontrar um erro de compilação relacionado ao construtor. LeaseManagementConfig Se você estiver criando diretamente um LeaseManagementConfig objeto para definir configurações em vez de usar ConfigsBuilder nas versões 3.x ou posteriores da KCL, talvez veja a seguinte mensagem de erro ao compilar o código do aplicativo KCL.


Cannot resolve constructor 'LeaseManagementConfig(String, DynamoDbAsyncClient, KinesisAsyncClient, String)'

O KCL com versões 3.x ou posteriores exige que você adicione mais um parâmetro, ApplicationName (type: String), após o parâmetro tableName.

Antes: leaseManagementConfig = new LeaseManagementConfig (tableName, DBClient dynamo, kinesisClient, streamName, WorkerIdentifier)
Depois de: leaseManagementConfig = new LeaseManagementConfig (tableName, applicationName, dynamo, kinesisClient, streamNameDBClient, WorkerIdentifier)

Em vez de criar diretamente um LeaseManagementConfig objeto, recomendamos usá-lo ConfigsBuilder para definir configurações no KCL 3.x e versões posteriores. ConfigsBuilderfornece uma maneira mais flexível e sustentável de configurar seu aplicativo KCL.

Veja a seguir um exemplo de uso ConfigsBuilder para definir configurações de KCL.


ConfigsBuilder configsBuilder = new ConfigsBuilder(
    streamName,
    applicationName,
    kinesisClient,
    dynamoClient,
    cloudWatchClient,
    UUID.randomUUID().toString(),
    new SampleRecordProcessorFactory()
);

Scheduler scheduler = new Scheduler(
    configsBuilder.checkpointConfig(),
    configsBuilder.coordinatorConfig(),
    configsBuilder.leaseManagementConfig()
    .failoverTimeMillis(60000), // this is an example
    configsBuilder.lifecycleConfig(),
    configsBuilder.metricsConfig(),
    configsBuilder.processorConfig(),
    configsBuilder.retrievalConfig()
);

Alguns registros do Kinesis Data Streams são ignorados quando a Kinesis Client Library é usada

A causa mais comum de registros ignorados é uma exceção não processada lançada de processRecords. A Kinesis Client Library (KCL) usa o processRecords para lidar com todas as exceções que ocorrem no processamento de registros de dados. Qualquer exceção lançada por processRecords é absorvida pela KCL. Para evitar infinitas novas tentativas no caso de uma falha recorrente, a KCL não reenvia o lote de registros processados no momento da exceção. A KCL chama processRecords para o próximo lote de registros de dados sem reiniciar o processador de registros. Isso resulta efetivamente em aplicativos consumidores observando registros ignorados. Para impedir registros ignorados, processe todas as exceções em processRecords da forma apropriada.

Registros pertencentes ao mesmo fragmento são processados por processadores de registros diferentes ao mesmo tempo

Para qualquer aplicação da Kinesis Client Library (KCL) em execução, cada fragmento tem apenas um proprietário. No entanto, vários processadores de registro pode temporariamente processar o mesmo fragmento. Se uma instância de trabalho perder a conectividade de rede, a KCL presume que o trabalhador inacessível não está mais processando registros após o término do tempo de failover e orienta outras instâncias de trabalho a assumirem o controle. Por um breve período, novos processadores de registros e processadores de registros provenientes do operador inacessível podem processar dados do mesmo fragmento.

Defina um tempo de failover adequado ao seu aplicativo. Para aplicativos de baixa latência, o padrão de 10 segundos pode representar o tempo máximo que deseja esperar. No entanto, nos casos em que se esperam problemas de conectividade, como fazer chamadas em áreas geográficas em que a conectividade pode ser perdida com mais frequência, esse número pode ser muito baixo.

O aplicativo deve prever e lidar com esse cenário, especialmente porque a conectividade de rede normalmente é restaurada para o operador anteriormente inacessível. Se um processador de registros tem seus fragmentos executados por outro processador de registros, ele deve lidar com os dois casos seguintes para executar o encerramento normal:

Depois que a chamada atual processRecords for concluída, o KCL invoca o método de desligamento no processador de gravação com o motivo de desligamento 'ZOMBIE'. Espera-se que seus processadores de registros limpem quaisquer recursos conforme apropriado e, em seguida, saiam.
Ao tentar criar um ponto de verificação a partir de um operador “zombie”, a KCL lança ShutdownException. Depois de receber essa exceção, seu código deve sair do método atual de forma limpa.

Para obter mais informações, consulte Lidar com registros duplicados.

O aplicativo consumidor está lendo a uma taxa menor que a esperada

Os motivos mais comuns para a throughput de leitura ser mais lenta do que o esperado são os seguintes:

Vários aplicativos consumidores com um total de leituras que excedem os limites por fragmento. Para obter mais informações, consulte Cotas e limites. Nesse caso, aumente o número de fragmentos no fluxo de dados do Kinesis.
O limite que especifica o número máximo de GetRecords por chamada pode ter sido configurado com um valor baixo. Usando a KCL, é possível configurar o operador com um valor baixo para a propriedade maxRecords. Em geral, recomendamos o uso dos padrões do sistema para essa propriedade.
A lógica em sua chamada processRecords está demorando mais do que o esperado por várias razões possíveis. A lógica pode usar muitos recursos da CPU, bloquear a E/S ou estar afunilada na sincronização. Para testar se isso é verdadeiro, teste a execução de processadores de registros vazios e comparar a throughput de leitura. Para obter informações sobre como acompanhar os dados de entrada, consulte Use refragmentação, escalonamento e processamento paralelo para alterar o número de fragmentos.

Se houver apenas uma aplicação de consumo, sempre é possível ler pelo menos duas vezes mais rápido do que a taxa de colocação. É possível gravar até 1.000 registros por segundo, até uma taxa máxima total de gravação de dados de 1 MB por segundo (incluindo chaves de partição). Cada fragmento aberto oferece suporte a até cinco transações por segundo para leituras, até uma taxa máxima total de leitura de dados de 2 MB por segundo. Observe que cada leitura (chamada a GetRecords) obtém um lote de registros. O tamanho dos dados retornados pelo GetRecords varia de acordo com a utilização do fragmento. O tamanho máximo de dados que GetRecords pode retornar é 10 MB. Se uma chamada retornar esse limite, as chamadas subsequentes feitas nos próximos 5 segundos gerarão umaProvisionedThroughputExceededException.

GetRecords retorna uma matriz de registros vazia mesmo quando há dados no fluxo

O consumo, ou a obtenção, de registros é um modelo de envio. Espera-se que os desenvolvedores GetRecordsliguem em um loop contínuo, sem atrasos. Cada chamada a GetRecords também retorna um valor de ShardIterator que deve ser usado na próxima iteração do loop.

A operação GetRecords não bloqueia. Em vez disso, ela retorna imediatamente; com registros de dados relevantes ou com um elemento Records vazio. Um elemento Records vazio é retornado em duas condições:

Atualmente, não há mais dados no fragmento.
Não há dados perto da parte do fragmento indicada pelo ShardIterator.

A última condição é sutil, mas é uma característica de compensação necessária para evitar tempo de busca ilimitado (latência) ao recuperar registros. Desse modo, a aplicação de consumo de fluxo deve fazer um loop e chamar GetRecords tratando os registros vazios como de costume.

Em um cenário de produção, o único momento em que o loop contínuo deve ser encerrado é quando o valor de NextShardIterator é NULL. Quando NextShardIterator é NULL, significa que o fragmento foi fechado e o valor de ShardIterator apontaria para além do último registro. Se o aplicativo consumidor nunca chamar SplitShard ou MergeShards, o fragmento permanecerá aberto e as chamadas a GetRecords nunca retornarão um valor de NextShardIterator que seja NULL.

Se você usa a Kinesis Client Library (KCL), o padrão de consumo anterior é resumido para você. Isso inclui a manipulação automática de um conjunto de fragmentos que mudam dinamicamente. Com a KCL, o desenvolvedor fornece apenas a lógica para processar registros de entrada. Isso é possível porque a biblioteca faz chamadas contínuas a GetRecords.

O iterador de fragmentos expira inesperadamente

Um novo iterador de fragmento é retornado por toda solicitação a GetRecords (como NextShardIterator), que é usado na próxima solicitação GetRecords (como ShardIterator). Normalmente, esse iterador do fragmento não expira antes de ser usado. No entanto, pode-se encontrar iteradores de fragmento que expiram por não chamar GetRecords por mais de cinco minutos, ou porque executar uma reinicialização da aplicação de consumo.

Se o iterador de fragmentos expirar imediatamente antes que você possa usá-lo, isso pode indicar que a tabela do DynamoDB usada pelo Kinesis não tem capacidade suficiente para armazenar os dados de concessão. Essa situação tem maior probabilidade de ocorrer se houver um grande número de fragmentos. Para solucionar esse problema, aumente a capacidade de gravação atribuída à tabela do fragmento. Para obter mais informações, consulte Usar uma tabela de concessões para monitorar os fragmentos processados pela aplicação de consumo da KCL.

Processamento de registros de consumidores ficando atrasados

Para a maioria dos casos de uso, as aplicações de consumo estão lendo os últimos dados do fluxo. Em determinadas circunstâncias, as leituras dos consumidores podem ficar atrasadas, o que pode não ser desejado. Depois de identificar a dimensão do atraso da leitura dos consumidores, veja os motivos mais comuns disso ocorrer.

Comece com a métrica GetRecords.IteratorAgeMilliseconds, que rastreia a posição de leitura em todos os fragmentos e aplicações de consumo no fluxo. Observe que, se a idade de um iterador passar de 50% do período de retenção (24 horas por padrão, configurável até 365 dias), haverá risco de perda de dados devido à expiração de registro. Uma solução provisória rápida é aumentar o período de retenção. Isso interrompe a perda de dados importantes enquanto o problema é solucionado. Para obter mais informações, consulte Monitorar o serviço Amazon Kinesis Data Streams com a Amazon CloudWatch. Em seguida, identifique o quão atrasado seu aplicativo consumidor está lendo cada fragmento usando uma CloudWatch métrica personalizada emitida pela Kinesis Client Library (KCL),. MillisBehindLatest Para obter mais informações, consulte Monitorar a Kinesis Client Library com a Amazon CloudWatch.

Veja os motivos mais comuns para consumidores ficarem atrasados:

Grandes aumentos súbitos em GetRecords.IteratorAgeMilliseconds ou MillisBehindLatest geralmente indicam um problema transitório, como falhas de operação da API para um aplicativo downstream. Investigue esses aumentos repentinos se alguma das métricas exibir esse comportamento de forma consistente.
Um aumento gradual nessas métricas indica que um consumidor não está acompanhando o fluxo porque não está processando registros com a rapidez necessária. As causas raiz mais comuns para esse comportamento são recursos físicos insuficientes ou lógica de processamento de registros que não escalou com o aumento na throughput do fluxo. Você pode verificar esse comportamento observando as outras CloudWatch métricas personalizadas que o KCL emite associadas à processTask operação, incluindo RecordProcessor.processRecords.TimeSuccess, e. RecordsProcessed
- Em caso de aumento na métrica processRecords.Time correlacionada ao aumento na throughput, deve-se analisar a lógica do processamento de registros para identificar por que ela não está se dimensionando de acordo com a maior throughput.
- Caso veja um aumento nos valores de processRecords.Time que não esteja correlacionado com aumento na throughput, verifique se estão sendo feitas chamadas de bloqueio no caminho crítico, que muitas vezes são a causa de lentidão no processamento de registros. Uma abordagem alternativa é aumentar o paralelismo, aumentando o número de fragmentos. Por fim, confirme se você tem uma quantidade adequada de recursos físicos (memória, utilização da CPU, entre outros) nos nós de processamento subjacentes durante o pico de demanda.

Erro de permissão de chave KMS não autorizada

Esse erro ocorre quando um aplicativo consumidor lê um fluxo criptografado sem permissões na AWS KMS chave. Para atribuir permissões a uma aplicação para que acesse uma chave do KMS, consulte Using Key Policies in AWS KMS e Using IAM Policies with AWS KMS.

DynamoDbException: o caminho do documento fornecido na expressão de atualização é inválido para atualização

Ao usar o KCL 3.x com AWS SDK para Java as versões 2.27.19 a 2.27.23, você pode encontrar a seguinte exceção do DynamoDB:

“software.amazon.awssdk.services.dynamodb.model. DynamoDbException: o caminho do documento fornecido na expressão de atualização é inválido para atualização (Serviço: DynamoDb, Código de status: 400, ID da solicitação: xxx)”

Esse erro ocorre devido a um problema conhecido AWS SDK para Java que afeta a tabela de metadados do DynamoDB gerenciada pelo KCL 3.x. O problema foi introduzido na versão 2.27.19 e afeta todas as versões até a 2.27.23. O problema foi resolvido na AWS SDK para Java versão 2.27.24. Para obter desempenho e estabilidade ideais, recomendamos a atualização para a versão 2.28.0 ou posterior.

Solucionar outros problemas comuns para consumidores

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Talend

Otimize os consumidores do Kinesis Data Streams