Tipos de dados comuns - AWS Glue

Tipos de dados comuns

Tipos de dados comuns descrevem os diversos tipos de dados comuns no AWS Glue.

Estrutura Tag

O objeto Tag representa um rótulo que pode ser atribuído a um recurso da AWS. Cada tag consiste de uma chave e um valor opcional, que podem ser definidos.

Para obter mais informações sobre tags e como controlar o acesso aos recursos no AWS Glue, consulte Marcações da AWS no AWS Glue) e Especificação de ARNs de recurso no AWS Glue no guia do desenvolvedor.

Campos
  • key – String UTF-8, superior a 1 e inferior a 128 bytes de comprimento.

    A chave de tags. A chave é necessária ao criar uma tag em um objeto. A chave diferencia maiúsculas de minúsculas e não deve conter o prefixo aws.

  • value – String UTF-8 com comprimento não superior a 256 bytes.

    O valor da tag. O valor é opcional ao criar uma tag em um objeto. O valor diferencia maiúsculas de minúsculas e não deve conter o prefixo aws.

Estrutura DecimalNumber

Contém um valor numérico em formato decimal.

Campos
  • UnscaledValue: obrigatório: blob.

    O valor numérico não escalado.

  • Scale: obrigatório: número (inteiro).

    A escala que determina a posição do ponto decimal no valor não escalado.

Estrutura ErrorDetail

Contém detalhes sobre um erro.

Campos
  • ErrorCode: string UTF-8 com no mínimo 1 e no máximo 255 bytes de comprimento e correspondente a Single-line string pattern.

    O código associado a este erro.

  • ErrorMessage: string de descrição com no máximo 2.048 bytes de comprimento e correspondente a URI address multi-line string pattern.

    Uma mensagem descrevendo o erro.

Estrutura PropertyPredicate

Define um predicado de propriedade.

Campos
  • Key: string Value com no mínimo 1 e no máximo 1.024 bytes de comprimento.

    A chave da propriedade.

  • Value: string Value com no mínimo 1 e no máximo 1.024 bytes de comprimento.

    O valor da propriedade.

  • Comparator – String UTF-8 (valores válidos: EQUALS | GREATER_THAN | LESS_THAN | GREATER_THAN_EQUALS | LESS_THAN_EQUALS).

    O comparador costumava comparar esta propriedade com outras.

Estrutura ResourceUri

Os URIs para recursos de função.

Campos
  • ResourceType – String UTF-8 (valores válidos: JAR | FILE | ARCHIVE).

    O tipo de recurso.

  • Uri – URI (Uniform Resource Identifier), maior que 1 ou maior que 1024 bytes de comprimento, correspondente a URI address multi-line string pattern.

    O URI para acessar o recurso.

Estrutura ColumnStatistics

Representa as estatísticas de nível de coluna geradas para uma tabela ou partição.

Campos
  • ColumnName: obrigatório: string UTF-8 com no mínimo 1 e no máximo 255 bytes de comprimento e correspondente a Single-line string pattern.

    Nome da coluna à qual as estatísticas pertencem.

  • ColumnType: obrigatório: nome do tipo, no máximo 20.000 bytes de comprimento, correspondente a Single-line string pattern.

    O tipo de dados da coluna.

  • AnalyzedTime: obrigatório: carimbo de data e hora.

    O carimbo de data e hora do momento em que as estatísticas da coluna foram geradas.

  • StatisticsDataObrigatório: um objeto ColumnStatisticsData.

    Um objeto ColumnStatisticData que contém os valores de dados de estatísticas.

Estrutura ColumnStatisticsError

Encapsula um objeto ColumnStatistics que tenha falhado e o motivo da falha.

Campos
  • ColumnStatistics: um objeto ColumnStatistics.

    As ColumnStatistics da coluna.

  • Error – Um objeto ErrorDetail.

    Uma mensagem de erro com o motivo da falha de uma operação.

Estrutura ColumnError

Encapsula um nome de coluna que tenha falhado e o motivo da falha.

Campos
  • ColumnName: string UTF-8 com no mínimo 1 e no máximo 255 bytes de comprimento e correspondente a Single-line string pattern.

    O nome da coluna que falhou.

  • Error – Um objeto ErrorDetail.

    Uma mensagem de erro com o motivo da falha de uma operação.

Estrutura ColumnStatisticsData

Contém os tipos individuais de dados de estatísticas de coluna. Apenas um objeto de dados deve ser definido e indicado pelo atributo Type.

Campos
  • Type: obrigatório: string UTF-8 (valores válidos: BOOLEAN | DATE | DECIMAL | DOUBLE | LONG | STRING | BINARY).

    O tipo de dados de estatísticas de coluna.

  • BooleanColumnStatisticsData: um objeto BooleanColumnStatisticsData.

    Dados de estatísticas de coluna booleanos.

  • DateColumnStatisticsData: um objeto DateColumnStatisticsData.

    Dados de estatísticas de coluna de data.

  • DecimalColumnStatisticsData: um objeto DecimalColumnStatisticsData.

    Dados de estatísticas de coluna decimais. UnscaledValues internos são objetos binários codificados na Base64 que armazenam representações big-endian de complemento de dois do valor da decimal sem escala.

  • DoubleColumnStatisticsData: um objeto DoubleColumnStatisticsData.

    Dados de estatísticas de coluna double.

  • LongColumnStatisticsData: um objeto LongColumnStatisticsData.

    Dados de estatísticas de coluna inteiros longos.

  • StringColumnStatisticsData: um objeto StringColumnStatisticsData.

    Dados de estatísticas de coluna de string.

  • BinaryColumnStatisticsData: um objeto BinaryColumnStatisticsData.

    Dados de estatísticas de coluna binários.

Estrutura BooleanColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados booleanos.

Campos
  • NumberOfTrues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores true na coluna.

  • NumberOfFalses: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores false na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

Estrutura DateColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados de carimbo de data e hora.

Campos
  • MinimumValue – Timestamp.

    O valor mais baixo na coluna.

  • MaximumValue – Timestamp.

    O valor mais alto na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura DecimalColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados de números de ponto fixo.

Campos
  • MinimumValue: um objeto DecimalNumber.

    O valor mais baixo na coluna.

  • MaximumValue: um objeto DecimalNumber.

    O valor mais alto na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura DoubleColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados de números de ponto flutuante.

Campos
  • MinimumValue – Número (duplo).

    O valor mais baixo na coluna.

  • MaximumValue – Número (duplo).

    O valor mais alto na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura LongColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados inteiros.

Campos
  • MinimumValue – Número (extenso).

    O valor mais baixo na coluna.

  • MaximumValue – Número (extenso).

    O valor mais alto na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura StringColumnStatisticsData

Define estatísticas de coluna suportadas para valores de dados de sequência de caracteres.

Campos
  • MaximumLength: obrigatório: número (inteiro longo), no máximo nenhum.

    O tamanho da string mais longa na coluna.

  • AverageLength: obrigatório: número (double), no máximo nenhum.

    O comprimento médio da string na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura BinaryColumnStatisticsData

Define estatísticas de coluna suportadas para valores de dados de sequência de bits.

Campos
  • MaximumLength: obrigatório: número (inteiro longo), no máximo nenhum.

    O tamanho da sequência de bits mais longa na coluna.

  • AverageLength: obrigatório: número (double), no máximo nenhum.

    O comprimento médio da sequência de bits na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

Padrões de string

A API usa as seguintes expressões regulares para definir o que é conteúdo válido para vários membros e parâmetros de string:

  • Single-line string pattern – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*"

  • Padrão de string com várias linhas de endereço URI – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*"

  • Um padrão de string Logstash Grok – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*"

  • Padrão de string do identificador – "[A-Za-z_][A-Za-z0-9_]*"

  • Padrão de string do ARN da AWS IAM – "arn:aws:iam::\d{12}:role/.*"

  • Versão do padrão de string – "^[a-zA-Z0-9-_]+$"

  • Padrão de string do grupo de logs – "[\.\-_/#A-Za-z0-9]+"

  • Padrão de string do stream de logs – "[^:*]*"

  • Padrão de string personalizado n.º 10: “[a-zA-Z0-9-_]+

  • Padrão de string personalizado n.º 11: “[-a-zA-Z0-9+=/:_]*

  • Padrão de string personalizado n.º 12: “[\S\s]*

  • Padrão de string personalizado n.º 13: “.*\S.*

  • Padrão de string personalizado n.º 14: “[a-zA-Z0-9-=._/@]+

  • Padrão de string personalizado n.º 15: “[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*

  • Padrão de string personalizado n.º 16: “[A-Z][A-Za-z\.]+

  • Padrão de string personalizado n.º 17: “[\S]*

  • Padrão de string personalizado n.º 18: “[\w]*

  • Padrão de string personalizado n.º 19: “arn:aws[a-z\-]*:iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

  • Padrão de string personalizado n.º 20: “subnet-[a-z0-9]+

  • Padrão de string personalizado n.º 21: “\d{12}

  • Padrão de string personalizado n.º 22: “([a-z]+)-([a-z]+-)?([a-z]+)-[0-9]+[a-z]+

  • Padrão de string personalizado n.º 23: "[a-zA-Z0-9.-]*"

  • Padrão de string personalizado n.º 24: "arn:aws[a-z0-9\-]*:lambda:[a-z0-9\-]+:\d{12}:function:([\w\-]{1,64})"

  • Padrão de string personalizado n.º 25: "^(?!(.*[.\/\\]|aws:)).*$"

  • Padrão de string personalizado n.º 26: "[^\r\n]"

  • Padrão de string personalizado n.º 27: "^\w+\.\w+\.\w+$"

  • Padrão de string personalizado n.º 28: "^\w+\.\w+$"

  • Padrão de string personalizado n.º 29: "arn:aws:kms:.*"

  • Padrão de string personalizado n.º 30: "arn:aws[^:]*:iam::[0-9]*:role/.+"

  • Padrão de string personalizado n.º 31: "[\.\-_A-Za-z0-9]+"

  • Padrão de string personalizado n.º 32: "^s3://([^/]+)/([^/]+/)*([^/]+)$"

  • Padrão de string personalizado n.º 33: ".*"

  • Padrão de string personalizado n.º 34: "^(Sun|Mon|Tue|Wed|Thu|Fri|Sat):([01]?[0-9]|2[0-3])$"

  • Padrão de string personalizado n.º 35: "[a-zA-Z0-9_.-]+"

  • Padrão de string personalizado n.º 36: "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:secretsmanager:.*$"

  • Padrão de string personalizado n.º 37: "\S+"

  • Padrão de string personalizado n.º 38: "^[\x20-\x7E]*$"

  • Padrão de string personalizado n.º 39: "^([a-zA-Z0-9_=]+)\.([a-zA-Z0-9_=]+)\.([a-zA-Z0-9_\-\+\/=]*)"

  • Padrão de string personalizado n.º 40: "^(https?)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]"

  • Padrão de string personalizado n.º 41: "^(https?):\/\/[^\s/$.?#].[^\s]*$"

  • Padrão de string personalizado n.º 42: "^subnet-[a-z0-9]+$"

  • Padrão de string personalizado n.º 43: “[\p{L}\p{N}\p{P}]*

  • Padrão de string personalizado n.º 44: “[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}

  • Padrão de string personalizado n.º 45: “[a-zA-Z0-9-_$#.]+

  • Padrão de string personalizado n.º 46: "^\d{12}$"

  • Padrão de string personalizado n.º 47: "^(\w+\.)+\w+$"

  • Padrão de string personalizado n.º 48: "^([2-3]|3[.]9)$"

  • Padrão de string personalizado n.º 49: "arn:aws(-(cn|us-gov|iso(-[bef])?))?:glue:.*"

  • Padrão de string personalizado n.º 50: "(^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::\w{12}:root)"

  • Padrão de string personalizado n.º 51: "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+"

  • Padrão de string personalizado n.º 52: "[\s\S]*"

  • Padrão de string personalizado n.º 53: "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*"

  • Padrão de string personalizado n.º 54: "^[A-Z\_]+$"

  • Padrão de string personalizado n.º 55: "^[A-Za-z0-9]+$"

  • Padrão de string personalizado n.º 56: "[*A-Za-z0-9_-]*"

  • Padrão de string personalizado n.º 57: "([\u0020-\u007E\r\s\n])*"

  • Padrão de string personalizado n.º 58: "[A-Za-z0-9_-]*"

  • Padrão de string personalizado n.º 59: "([\u0009\u000B\u000C\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF])*"

  • Padrão de string personalizado n.º 60: "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*"

  • Padrão de string personalizado n.º 61: "([^\r\n])*"