Tipos de datos comunes - AWS Glue

Tipos de datos comunes

Los tipos de datos comunes describen diversos tipos de datos comunes en AWS Glue.

Estructura de Tag

El objeto Tag representa una etiqueta que se puede asignar a un recurso de AWS. Cada etiqueta está formada por una clave y un valor opcional, ambos definidos por el usuario.

Para obtener más información acerca de las etiquetas y controlar el acceso a los recursos en AWS Glue, consulte Etiquetas de AWS en AWS Glue y Especificación de ARN de recursos de AWS Glue en la Guía para desarrolladores.

Campos

  • key: cadena UTF-8, con 1 byte de largo como mínimo y 128 bytes de largo como máximo.

    La clave de la etiqueta. La clave es necesaria para crear una etiqueta en un objeto. La clave distingue entre mayúsculas y minúsculas y no debe contener el prefijo aws.

  • value: cadena UTF-8 de 256 bytes de largo como máximo.

    El valor de la etiqueta. El valor es opcional para crear una etiqueta en un objeto. El valor distingue entre mayúsculas y minúsculas y no debe contener el prefijo aws.

Estructura de DecimalNumber

Contiene un valor numérico en formato decimal.

Campos

  • UnscaledValueObligatorio: Blob.

    El valor numérico sin escala.

  • ScaleObligatorio: número (entero).

    Escala que determina la ubicación de punto decimal en el valor sin escala.

Estructura de ErrorDetail

Contiene detalles sobre un error.

Campos

  • ErrorCode: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El código asociado a este error.

  • ErrorMessage: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Mensaje que describe el error.

Estructura de PropertyPredicate

Define el predicado de una propiedad.

Campos

  • Key: cadena de valor, de 1024 bytes de largo como máximo.

    La clave de la propiedad.

  • Value: cadena de valor, de 1024 bytes de largo como máximo.

    El valor de la propiedad.

  • Comparator: cadena UTF-8 (valores válidos: EQUALS | GREATER_THAN | LESS_THAN | GREATER_THAN_EQUALS | LESS_THAN_EQUALS).

    El comparador utilizado para comparar esta propiedad con otras

Estructura de ResourceUri

Las URI para los recursos de función.

Campos

  • ResourceType: cadena UTF-8 (valores válidos: JAR | FILE | ARCHIVE).

    El tipo de recurso.

  • Uri: identificador uniforme de recursos (uri), con 1 byte de largo como mínimo y 1024 bytes de largo como máximo, que coincide con el URI address multi-line string pattern.

    El URI para obtener acceso al recurso.

Estructura ColumnStatistics

Representa las estadísticas de nivel de columna generadas para una tabla o partición.

Campos

  • ColumnNameObligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la columna a la que pertenecen las estadísticas.

  • ColumnTypeObligatorio: nombre de tipo, de 20 000 bytes de largo como máximo, que coincide con Single-line string pattern.

    El tipo de datos de la columna.

  • AnalyzedTimeObligatorio: marca temporal.

    Marca temporal del momento en que se generaron las estadísticas de columna.

  • StatisticsDataObligatorio: objeto ColumnStatisticsData.

    Objeto ColumnStatisticData que contiene los valores de datos estadísticos.

Estructura ColumnStatisticsError

Encapsula un objeto ColumnStatistics que presentó error y el motivo del error.

Campos

  • ColumnStatistics: objeto ColumnStatistics.

    Las ColumnStatistics de la columna.

  • Error: objeto ErrorDetail.

    Un mensaje de error con el motivo del error de una operación.

Estructura ColumnError

Encapsula un nombre columna que presentó error y el motivo del error.

Campos

  • ColumnName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la columna que presentó error.

  • Error: objeto ErrorDetail.

    Un mensaje de error con el motivo del error de una operación.

Estructura ColumnStatisticsData

Contiene los tipos individuales de datos estadísticos de columna. Solo se debe establecer un objeto de datos e indicar mediante el atributo Type.

Campos

Estructura BooleanColumnStatisticsData

Define las estadísticas de columna soportadas para las columnas de datos booleanos.

Campos

  • NumberOfTruesObligatorio: número (largo), cero como máximo.

    El número de valores verdaderos en la columna.

  • NumberOfFalsesObligatorio: número (largo), cero como máximo.

    El número de valores falsos en la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

Estructura DateColumnStatisticsData

Define las estadísticas de columna soportadas para las columnas de datos de marca temporal.

Campos

  • MinimumValue – Marca temporal.

    El valor más bajo de la columna.

  • MaximumValue – Marca temporal.

    El valor más alto de la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

Estructura DecimalColumnStatisticsData

Define las estadísticas de columna soportadas para las columnas de datos de números con coma fija.

Campos

  • MinimumValue: objeto DecimalNumber.

    El valor más bajo de la columna.

  • MaximumValue: objeto DecimalNumber.

    El valor más alto de la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

Estructura DoubleColumnStatisticsData

Define las estadísticas de columna soportadas para las columnas de datos de números con coma flotante.

Campos

  • MinimumValue: número (doble).

    El valor más bajo de la columna.

  • MaximumValue: número (doble).

    El valor más alto de la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

Estructura LongColumnStatisticsData

Define las estadísticas de columna soportadas para las columnas de datos enteros.

Campos

  • MinimumValue: número (largo).

    El valor más bajo de la columna.

  • MaximumValue: número (largo).

    El valor más alto de la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

Estructura StringColumnStatisticsData

Define estadísticas de columna admitidas para valores de datos de secuencia de caracteres.

Campos

  • MaximumLengthObligatorio: número (largo), cero como máximo.

    El tamaño de la cadena más larga de la columna.

  • AverageLengthObligatorio: número (doble), cero como máximo.

    La longitud media de la cadena en la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

  • NumberOfDistinctValuesObligatorio: número (largo), cero como máximo.

    El número de valores distintos de una columna.

Estructura BinaryColumnStatisticsData

Define estadísticas de columna soportadas para valores de datos de secuencia de bits.

Campos

  • MaximumLengthObligatorio: número (largo), cero como máximo.

    El tamaño de la secuencia de bits más larga de la columna.

  • AverageLengthObligatorio: número (doble), cero como máximo.

    La longitud media de secuencia de bits en la columna.

  • NumberOfNullsObligatorio: número (largo), cero como máximo.

    El número de valores nulos en la columna.

Patrones de cadena

La API utiliza las siguientes expresiones regulares para definir qué es un contenido válido para diversos miembros y parámetros de cadena:

  • Patrón de cadena de línea única: "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*"

  • Patrón de cadena de varias líneas de la dirección URI: "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*"

  • Patrón de cadena Grok Logstash: "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*"

  • Patrón de cadena del identificador: "[A-Za-z_][A-Za-z0-9_]*"

  • Patrón de cadena de ARN de AWS IAM: "arn:aws:iam::\d{12}:role/.*"

  • Patrón de cadena de versión: "^[a-zA-Z0-9-_]+$"

  • Patrón de cadena de grupo de registros: "[\.\-_/#A-Za-z0-9]+"

  • Patrón de cadena de flujo de registro: "[^:*]*"

  • Patrón de cadena personalizado n.º 10: “[^\r\n]

  • Patrón de cadena personalizado n.º 11: “[\p{L}\p{N}\p{P}]*

  • Patrón de cadena personalizado n.º 12: “[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}

  • Patrón de cadena personalizado n.º 13: “[a-zA-Z0-9-_$#.]+

  • Patrón de cadena personalizado n.º 14: “^\w+\.\w+\.\w+$

  • Patrón de cadena personalizado n.º 15: “^\w+\.\w+$

  • Patrón de cadena personalizado n.º 16: “^([2-3]|3[.]9)$

  • Patrón de cadena personalizado n.º 17: “arn:(aws|aws-us-gov|aws-cn):glue:.*

  • Patrón de cadena personalizado n.º 18: “(^arn:aws:iam::\w{12}:root)

  • Patrón de cadena personalizado n.º 19: “arn:aws:kms:.*

  • Patrón de cadena personalizado n.º 20: “arn:aws[^:]*:iam::[0-9]*:role/.+

  • Patrón de cadena personalizado n.º 21: “[\.\-_A-Za-z0-9]+

  • Patrón de cadena personalizado n.º 22: “^s3://([^/]+)/([^/]+/)*([^/]+)$

  • Patrón de cadena personalizado n.º 23: “.*\S.*

  • Patrón de cadena personalizado n.º 24: “[a-zA-Z0-9+-=._./@]+

  • Patrón de cadena personalizado n.º 25: “[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*

  • Patrón de cadena personalizado n.º 26: “[\s\S]*

  • Patrón de cadena personalizado n.º 27: “([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*

  • Patrón de cadena personalizado n.º 28: “[*A-Za-z0-9_-]*

  • Patrón de cadena personalizado n.º 29: “[A-Za-z0-9_-]*

  • Patrón de cadena personalizado n.º 30: “([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'])*

  • Patrón de cadena personalizado n.º 31: “([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n])*

  • Patrón de cadena personalizado n.º 32: “([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*

  • Patrón de cadena personalizado n.º 33: “([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\r\n])*