Tipos de datos comunes - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tipos de datos comunes

Los tipos de datos comunes describen diversos tipos de datos comunes en AWS Glue.

Estructura de etiquetas

El Tag objeto representa una etiqueta que se puede asignar a un AWS recurso. Cada etiqueta está formada por una clave y un valor opcional, ambos definidos por el usuario.

Para obtener más información sobre las etiquetas y el control del acceso a los recursos AWS Glue, consulte AWS Etiquetar AWS Glue y especificar los ARN de los AWS Glue recursos en la guía para desarrolladores.

Campos
  • key: cadena UTF-8, con 1 byte de largo como mínimo y 128 bytes de largo como máximo.

    La clave de la etiqueta. La clave es necesaria para crear una etiqueta en un objeto. La clave distingue entre mayúsculas y minúsculas y no debe contener el prefijo aws.

  • value: cadena UTF-8 de 256 bytes de largo como máximo.

    El valor de la etiqueta. El valor es opcional para crear una etiqueta en un objeto. El valor distingue entre mayúsculas y minúsculas y no debe contener el prefijo aws.

DecimalNumber estructura

Contiene un valor numérico en formato decimal.

Campos
  • UnscaledValueObligatorio: Blob.

    El valor numérico sin escala.

  • ScaleObligatorio: número (entero).

    Escala que determina la ubicación de punto decimal en el valor sin escala.

ErrorDetail estructura

Contiene detalles sobre un error.

Campos
  • ErrorCode: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El código asociado a este error.

  • ErrorMessage: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Mensaje que describe el error.

PropertyPredicate estructura

Define el predicado de una propiedad.

Campos
  • Key: cadena de valor, de 1024 bytes de largo como máximo.

    La clave de la propiedad.

  • Value: cadena de valor, de 1024 bytes de largo como máximo.

    El valor de la propiedad.

  • Comparator: cadena UTF-8 (valores válidos: EQUALS | GREATER_THAN | LESS_THAN | GREATER_THAN_EQUALS | LESS_THAN_EQUALS).

    El comparador utilizado para comparar esta propiedad con otras

ResourceUri estructura

Las URI para los recursos de función.

Campos
  • ResourceType: cadena UTF-8 (valores válidos: JAR | FILE | ARCHIVE).

    El tipo de recurso.

  • Uri: identificador uniforme de recursos (uri), con 1 byte de largo como mínimo y 1024 bytes de largo como máximo, que coincide con el URI address multi-line string pattern.

    El URI para obtener acceso al recurso.

ColumnStatistics estructura

Representa las estadísticas de nivel de columna generadas para una tabla o partición.

Campos
  • ColumnName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la columna a la que pertenecen las estadísticas.

  • ColumnTypeObligatorio: nombre de tipo, de 20 000 bytes de largo como máximo, que coincide con Single-line string pattern.

    El tipo de datos de la columna.

  • AnalyzedTimeObligatorio: marca temporal.

    Marca temporal del momento en que se generaron las estadísticas de columna.

  • StatisticsData: obligatorio: objeto ColumnStatisticsData.

    Objeto ColumnStatisticData que contiene los valores de datos estadísticos.

ColumnStatisticsError estructura

Encapsula un objeto ColumnStatistics que presentó error y el motivo del error.

Campos
  • ColumnStatistics: un objeto ColumnStatistics.

    Las ColumnStatistics de la columna.

  • Error: un objeto ErrorDetail.

    Un mensaje de error con el motivo del error de una operación.

ColumnError estructura

Encapsula un nombre columna que presentó error y el motivo del error.

Campos
  • ColumnName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la columna que presentó error.

  • Error: un objeto ErrorDetail.

    Un mensaje de error con el motivo del error de una operación.

ColumnStatisticsData estructura

Contiene los tipos individuales de datos estadísticos de columna. Solo se debe establecer un objeto de datos e indicar mediante el atributo Type.

Campos
  • TypeObligatorio: cadena UTF-8 (valores válidos: BOOLEAN | DATE | DECIMAL | DOUBLE | LONG | STRING | BINARY).

    Los datos estadísticos del tipo de columna.

  • BooleanColumnStatisticsData: un objeto BooleanColumnStatisticsData.

    Datos estadísticos de columnas booleanas.

  • DateColumnStatisticsData: un objeto DateColumnStatisticsData.

    Datos estadísticos de columnas de fecha.

  • DecimalColumnStatisticsData: un objeto DecimalColumnStatisticsData.

    Datos estadísticos de columnas decimales. UnscaledValues Dentro hay objetos binarios codificados en Base64 que almacenan representaciones en mayodiano, es decir, complementarias de dos, del valor no escalado del decimal.

  • DoubleColumnStatisticsData: un objeto DoubleColumnStatisticsData.

    Datos estadísticos de doble columna.

  • LongColumnStatisticsData: un objeto LongColumnStatisticsData.

    Datos estadísticos de columna larga.

  • StringColumnStatisticsData: un objeto StringColumnStatisticsData.

    Datos estadísticos de columnas de cadena.

  • BinaryColumnStatisticsData: un objeto BinaryColumnStatisticsData.

    Datos estadísticos de columnas binarias.

BooleanColumnStatisticsData estructura

Define las estadísticas de columna soportadas para las columnas de datos booleanos.

Campos
  • NumberOfTruesObligatorio: número (largo), cero como máximo.

    El número de valores verdaderos en la columna.

  • NumberOfFalsesObligatorio: número (largo), cero como máximo.

    El número de valores falsos en la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

DateColumnStatisticsData estructura

Define las estadísticas de columna soportadas para las columnas de datos de marca temporal.

Campos
  • MinimumValue: marca temporal.

    El valor más bajo de la columna.

  • MaximumValue: marca temporal.

    El valor más alto de la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

DecimalColumnStatisticsData estructura

Define las estadísticas de columna soportadas para las columnas de datos de números con coma fija.

Campos
  • MinimumValue: un objeto DecimalNumber.

    El valor más bajo de la columna.

  • MaximumValue: un objeto DecimalNumber.

    El valor más alto de la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

DoubleColumnStatisticsData estructura

Define las estadísticas de columna soportadas para las columnas de datos de números con coma flotante.

Campos
  • MinimumValue: número (doble).

    El valor más bajo de la columna.

  • MaximumValue: número (doble).

    El valor más alto de la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

LongColumnStatisticsData estructura

Define las estadísticas de columna soportadas para las columnas de datos enteros.

Campos
  • MinimumValue: número (largo).

    El valor más bajo de la columna.

  • MaximumValue: número (largo).

    El valor más alto de la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

StringColumnStatisticsData estructura

Define estadísticas de columna admitidas para valores de datos de secuencia de caracteres.

Campos
  • MaximumLengthObligatorio: número (largo), cero como máximo.

    El tamaño de la cadena más larga de la columna.

  • AverageLengthObligatorio: número (doble), cero como máximo.

    La longitud media de la cadena en la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

BinaryColumnStatisticsData estructura

Define estadísticas de columna soportadas para valores de datos de secuencia de bits.

Campos
  • MaximumLengthObligatorio: número (largo), cero como máximo.

    El tamaño de la secuencia de bits más larga de la columna.

  • AverageLengthObligatorio: número (doble), cero como máximo.

    La longitud media de secuencia de bits en la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

Patrones de cadena

La API utiliza las siguientes expresiones regulares para definir qué es un contenido válido para diversos miembros y parámetros de cadena:

  • Patrón de cadena de línea única: "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*"

  • Patrón de cadena de varias líneas de la dirección URI: "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*"

  • Patrón de cadena Grok Logstash: "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*"

  • Patrón de cadena del identificador: "[A-Za-z_][A-Za-z0-9_]*"

  • Patrón de cadena de ARN de AWS IAM: "arn:aws:iam::\d{12}:role/.*"

  • Patrón de cadena de versión: "^[a-zA-Z0-9-_]+$"

  • Patrón de cadena de grupo de registros: "[\.\-_/#A-Za-z0-9]+"

  • Patrón de cadena de flujo de registro: "[^:*]*"

  • Patrón de cadena personalizado n.º 10: “[^\r\n]

  • Patrón de cadena personalizado n.º 11: “^arn:aws(-(cn|us-gov|iso(-[bef])?))?:secretsmanager:.*$

  • Patrón de cadena personalizado n.º 12: “^(https?)://[-a-zA-Z0-9+@#/%?=~_|!:,.;]*[-a-zA-Z0-9+@#/%=~_|]

  • Patrón de cadena personalizado n.º 13: “\S+

  • Patrón de cadena personalizado n.º 14: “^(https?):\/\/[^\s/$.?#].[^\s]*$

  • Patrón de cadena personalizado n.º 15: “^subnet-[a-z0-9]+$

  • Patrón de cadena personalizado n.º 16: “[\p{L}\p{N}\p{P}]*

  • Patrón de cadena personalizado n.º 17: “[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}

  • Patrón de cadena personalizado n.º 18: “[a-zA-Z0-9-_$#.]+

  • Patrón de cadena personalizado n.º 19: “^\w+\.\w+\.\w+$

  • Patrón de cadena personalizado n.º 20: “^\w+\.\w+$

  • Patrón de cadena personalizado n.º 21: “^([2-3]|3[.]9)$

  • Patrón de cadena personalizado n.º 22: “arn:(aws|aws-us-gov|aws-cn):glue:.*

  • Patrón de cadena personalizado n.º 23: “(^arn:aws:iam::\w{12}:root)

  • Patrón de cadena personalizado n.º 24: “^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+

  • Patrón de cadena personalizado n.º 25: “arn:aws:kms:.*

  • Patrón de cadena personalizado n.º 26: “arn:aws[^:]*:iam::[0-9]*:role/.+

  • Patrón de cadena personalizado n.º 27: “[\.\-_A-Za-z0-9]+

  • Patrón de cadena personalizado n.º 28: “^s3://([^/]+)/([^/]+/)*([^/]+)$

  • Patrón de cadena personalizado n.º 29: “.*

  • Patrón de cadena personalizado n.º 30: “^(Sun|Mon|Tue|Wed|Thu|Fri|Sat):([01]?[0-9]|2[0-3])$

  • Patrón de cadena personalizado n.º 31: “[a-zA-Z0-9_.-]+

  • Patrón de cadena personalizado n.º 32: “.*\S.*

  • Patrón de cadena personalizado n.º 33: “[a-zA-Z0-9-=._/@]+

  • Patrón de cadena personalizado n.º 34: “[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*

  • Patrón de cadena personalizado n.º 35: “[\s\S]*

  • Patrón de cadena personalizado N.º 36: “([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*

  • Patrón de cadena personalizado N.º 37: “[*A-Za-z0-9_-]*

  • Patrón de cadena personalizado N.º 38: «([\u0020-\u007E\r\s\n])*»

  • Patrón de cadena personalizado N.º 39: «[A-Za-z0-9_-]*»

  • Patrón de cadena personalizado N.º 40: «([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'])*»

  • Patrón de cadena personalizado N.º 41: «([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n])*»

  • Patrón de cadena personalizado N.º 42: «([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*»

  • Patrón de cadena personalizado #43 — "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\r\n])*»