Uso do formato grokLog no AWS Glue - AWS Glue

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Uso do formato grokLog no AWS Glue

O AWS Glue recupera dados de fontes e grava dados em destinos armazenados e transportados em vários formatos de dados. Se seus dados forem armazenados ou transportados em um formato de texto não criptografado fracamente estruturado, o documento apresenta os recursos disponíveis para usar seus dados no AWS Glue por meio de padrões Grok.

O AWS Glue é compatível com o uso de padrões Grok. Os padrões Grok são semelhantes aos grupos de captura de expressões regulares. Eles reconhecem padrões de sequências de caracteres em um arquivo de texto simples e fornecem um tipo e propósito. No AWS Glue, seu objetivo principal é ler logs. Para ver uma apresentação do Grok feita pelos autores, consulte Logstash Reference: Grok filter plugin (Referência do Logstash: plugin de filtro Grok).

Leitura Escrever Leitura de transmissão Agrupar arquivos pequenos Marcadores de trabalho
Compatível Não aplicável Compatível Compatível Sem suporte

Referência da configuração grokLog

Você pode usar os seguintes valores de format_options com format="grokLog":

  • logFormat: especifica o padrão Grok que corresponde ao formato de log.

  • customPatterns: especifica outros padrões Grok usados aqui.

  • MISSING: especifica o sinal a ser usado na identificação de valores ausentes. O padrão é '-'.

  • LineCount: especifica o número de linhas em cada registro de log. O padrão é '1', e atualmente somente os registros de linha única são compatíveis.

  • StrictMode: um valor booliano que especifica se o modo estrito está habilitado. No modo estrito, o leitor não faz conversão ou recuperação de tipo automática. O valor padrão é "false".