Uso do formato grokLog no AWS Glue
O AWS Glue recupera dados de fontes e grava dados em destinos armazenados e transportados em vários formatos de dados. Se seus dados forem armazenados ou transportados em um formato de texto não criptografado fracamente estruturado, o documento apresenta os recursos disponíveis para usar seus dados no AWS Glue por meio de padrões Grok.
O AWS Glue é compatível com o uso de padrões Grok. Os padrões Grok são semelhantes aos grupos de captura de expressões regulares. Eles reconhecem padrões de sequências de caracteres em um arquivo de texto simples e fornecem um tipo e propósito. No AWS Glue, seu objetivo principal é ler logs. Para ver uma apresentação do Grok feita pelos autores, consulte Logstash Reference: Grok filter plugin
Leitura | Escrever | Leitura de transmissão | Agrupar arquivos pequenos | Marcadores de trabalho |
---|---|---|---|---|
Compatível | Não aplicável | Compatível | Compatível | Sem suporte |
Referência da configuração grokLog
Você pode usar os seguintes valores de format_options
com format="grokLog"
:
logFormat
: especifica o padrão Grok que corresponde ao formato de log.customPatterns
: especifica outros padrões Grok usados aqui.MISSING
: especifica o sinal a ser usado na identificação de valores ausentes. O padrão é'-'
.LineCount
: especifica o número de linhas em cada registro de log. O padrão é'1'
, e atualmente somente os registros de linha única são compatíveis.StrictMode
: um valor booliano que especifica se o modo estrito está habilitado. No modo estrito, o leitor não faz conversão ou recuperação de tipo automática. O valor padrão é"false"
.