API de Calidad de datos - AWS Glue
 —  tipos de datos  —DataSourceDataQualityRulesetListDetailsDataQualityTargetTableDataQualityRulesetEvaluationRunDescriptionDataQualityRulesetEvaluationRunFilterDataQualityEvaluationRunAdditionalRunOptionsDataQualityRuleRecommendationRunDescriptionDataQualityRuleRecommendationRunFilterDataQualityResultDataQualityRuleResultDataQualityResultDescriptionDataQualityResultFilterCriteriaDataQualityRulesetFilterCriteria —  operaciones  —StartDataQualityRulesetEvaluationRun (start_data_quality_ruleset_ruleset_evaluation_run)CancelDataQualityRulesetEvaluationRun (cancel_data_quality_ruleset_ruleset_evaluation_run)GetDataQualityRulesetEvaluationRun (get_data_quality_ruleset_evaluation_run)ListDataQualityRulesetEvaluationRuns (list_data_quality_ruleset_evaluation_runs)StartDataQualityRuleRecommendationRun (start_data_quality_rule_recommendation_run)CancelDataQualityRuleRecommendationRun (cancel_data_quality_rule_recommendation_run)GetDataQualityRuleRecommendationRun (get_data_quality_rule_recommendation_run)ListDataQualityRuleRecommendationRuns (list_data_quality_rule_recommendation_runs)GetDataQualityResult (get_data_quality_result)BatchGetDataQualityResult (batch_get_data_quality_result)ListDataQualityResults (list_data_quality_results)CreateDataQualityRuleset (Create_data_quality_ruleset)DeleteDataQualityRuleset (Delete_data_quality_ruleset)GetDataQualityRuleset (get_data_quality_ruleset)ListDataQualityRulesets (conjuntos de reglas de list_data_quality_)UpdateDataQualityRuleset (update_data_quality_ruleset)

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

API de Calidad de datos

La API de Calidad de datos describe los tipos de datos de la calidad de los datos e incluye la API para crear, eliminar o actualizar conjuntos de reglas, ejecuciones y evaluadores de la calidad de datos.

Tipos de datos

DataSource estructura

Un origen de datos (una tabla de AWS Glue) para obtener los resultados de la calidad de los datos.

Campos
  • GlueTable: obligatorio: objeto GlueTable.

    Una tabla de AWS Glue.

DataQualityRulesetListDetails estructura

Describe un conjunto de reglas de la calidad de los datos devuelto por GetDataQualityRuleset.

Campos
  • Name: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del conjunto de reglas de calidad de datos.

  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Una descripción del conjunto de reglas de calidad de datos.

  • CreatedOn: marca temporal.

    La fecha y la hora en que se creó el conjunto de reglas de calidad de datos.

  • LastModifiedOn: marca temporal.

    La fecha y la hora de la última modificación del conjunto de reglas de calidad de datos.

  • TargetTable: objeto DataQualityTargetTable.

    Un objeto que representa una tabla de AWS Glue.

  • RecommendationRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cuando se crea un conjunto de reglas a partir de una ejecución de recomendación, se genera este ID de ejecución para vincularlos ambos.

  • RuleCount: número (entero).

    La cantidad de reglas del conjunto de reglas.

DataQualityTargetTable estructura

Un objeto que representa una tabla de AWS Glue.

Campos
  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la tabla de AWS Glue.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos donde se encuentra la tabla de AWS Glue.

DataQualityRulesetEvaluationRunDescription estructura

Describe el resultado de una ejecución de evaluación del conjunto de reglas de calidad de datos.

Campos
  • RunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

  • Status: cadena UTF-8 (valores válidos: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    El estado de esta ejecución.

  • StartedOn: marca temporal.

    La fecha y la hora en que inició la ejecución.

  • DataSource: objeto DataSource.

    El origen de datos (una tabla de AWS Glue) asociado a la ejecución.

DataQualityRulesetEvaluationRunFilter estructura

Los criterios del filtro.

Campos
  • DataSource: obligatorio: objeto DataSource.

    Filtre en función de un origen de datos (una tabla de AWS Glue) asociado a la ejecución.

  • StartedBefore: marca temporal.

    Filtre los resultados por las ejecuciones que se iniciaron antes de esta hora.

  • StartedAfter: marca temporal.

    Filtre los resultados por las ejecuciones que se iniciaron después de esta hora.

DataQualityEvaluationRunAdditionalRunOptions estructura

Opciones de ejecución adicionales que puede especificar para una ejecución de evaluación.

Campos
  • CloudWatchMetricsEnabled: booleano.

    Si se habilitan o no CloudWatch las métricas.

  • ResultsS3Prefix: cadena UTF-8.

    Prefijo para que Amazon S3 almacene los resultados.

DataQualityRuleRecommendationRunDescription estructura

Describe el resultado de una ejecución de recomendación de reglas de la calidad de los datos.

Campos
  • RunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

  • Status: cadena UTF-8 (valores válidos: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    El estado de esta ejecución.

  • StartedOn: marca temporal.

    La fecha y la hora en las que se inició esta ejecución.

  • DataSource: objeto DataSource.

    El origen de datos (tabla de AWS Glue) asociado a la ejecución de recomendación.

DataQualityRuleRecommendationRunFilter estructura

Se ejecuta un filtro para enumerar las ejecuciones de recomendación de la calidad de los datos.

Campos
  • DataSource: obligatorio: objeto DataSource.

    Filtre en función de un origen de datos especificado (tabla de AWS Glue).

  • StartedBefore: marca temporal.

    Filtre en función de la hora de los resultados que se iniciaron antes de la hora indicada.

  • StartedAfter: marca temporal.

    Filtre en función de la hora de los resultados que se iniciaron después de la hora indicada.

DataQualityResult estructura

Describe un resultado de la calidad de los datos.

Campos
  • ResultId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Un identificador de resultado único para el resultado de la calidad de los datos.

  • Score: número (doble), 1,0 como máximo.

    Una puntuación agregada de la calidad de los datos. Representa la relación entre las reglas aprobadas y la cantidad total de reglas.

  • DataSource: objeto DataSource.

    La tabla asociada al resultado de calidad de datos, si existe.

  • RulesetName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del conjunto de reglas asociado al resultado de calidad de datos.

  • EvaluationContext: cadena UTF-8.

    En relación con un trabajo en AWS Glue Studio, a cada nodo del lienzo se le suele asignar algún tipo de nombre y los nodos de calidad de datos tendrán nombres. En el caso de varios nodos, evaluationContext puede diferenciar los nodos.

  • StartedOn: marca temporal.

    La fecha y la hora en las que se inició esta ejecución de la calidad de los datos.

  • CompletedOn: marca temporal.

    La fecha y la hora en las que finalizó esta ejecución de la calidad de los datos.

  • JobName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del trabajo asociado al resultado de calidad de datos, si existe.

  • JobRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID de la ejecución del trabajo asociado al resultado de calidad de datos, si existe.

  • RulesetEvaluationRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID único de la ejecución para la evaluación del conjunto de reglas de este resultado de calidad de datos.

  • RuleResults: una matriz de objetos DataQualityRuleResult, con 1 estructura como mínimo y 2000 estructuras como máximo.

    Una lista de objetos DataQualityRuleResult que representan los resultados de cada regla.

DataQualityRuleResult estructura

Describe el resultado de la evaluación de la regla de la calidad de datos.

Campos
  • Name: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la regla de la calidad de datos.

  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Descripción de la regla de la calidad de datos.

  • EvaluationMessage: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Un mensaje de evaluación.

  • Result: cadena UTF-8 (valores válidos: PASS | FAIL | ERROR).

    Estado de aprobación o rechazo de la regla.

DataQualityResultDescription estructura

Describe un resultado de la calidad de los datos.

Campos
  • ResultId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador único de este resultado de la calidad de datos.

  • DataSource: objeto DataSource.

    El nombre de la tabla asociada al resultado de la calidad de datos.

  • JobName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del trabajo asociado al resultado de la calidad de datos.

  • JobRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de la ejecución del trabajo asociado al resultado de la calidad de datos.

  • StartedOn: marca temporal.

    La hora a la que se inició la ejecución de este resultado de la calidad de datos.

DataQualityResultFilterCriteria estructura

Criterios utilizados para devolver los resultados de la calidad de los datos.

Campos
  • DataSource: objeto DataSource.

    Filtre los resultados por el origen de datos especificado. Por ejemplo, mediante la recuperación de todos los resultados de una tabla de AWS Glue.

  • JobName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Filtre los resultados por el nombre de trabajo indicado.

  • JobRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Filtre los resultados por el identificador de la ejecución de trabajo indicado.

  • StartedAfter: marca temporal.

    Filtre los resultados por las ejecuciones que se iniciaron después de esta hora.

  • StartedBefore: marca temporal.

    Filtre los resultados por las ejecuciones que se iniciaron antes de esta hora.

DataQualityRulesetFilterCriteria estructura

Criterios utilizados para filtrar los conjuntos de reglas de calidad de datos.

Campos
  • Name: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de los criterios del filtro del conjunto de reglas.

  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    La descripción de los criterios del filtro del conjunto de reglas.

  • CreatedBefore: marca temporal.

    Filtre los conjuntos de reglas creados antes de esta fecha.

  • CreatedAfter: marca temporal.

    Filtre los conjuntos de reglas creados después de esta fecha.

  • LastModifiedBefore: marca temporal.

    Filtre los últimos conjuntos de reglas modificados antes de esta fecha.

  • LastModifiedAfter: marca temporal.

    Filtre los últimos conjuntos de reglas modificados después de esta fecha.

  • TargetTable: objeto DataQualityTargetTable.

    El nombre de la base de datos y el nombre de la tabla de destino.

Operaciones

StartDataQualityRulesetEvaluationRun Acción (Python: start_data_quality_run)

Una vez que tenga una definición del conjunto de reglas (recomendada o propia), ejecute esta operación para evaluar el conjunto de reglas con respecto a un origen de datos (tabla de AWS Glue). La evaluación calcula los resultados que puede recuperar con la API de GetDataQualityResult.

Solicitud
  • DataSource: obligatorio: objeto DataSource.

    El origen de datos (tabla de AWS Glue) asociado a esta ejecución.

  • RoleObligatorio: cadena UTF-8.

    Un rol de IAM que se proporciona para cifrar los resultados de la ejecución.

  • NumberOfWorkers: número (entero).

    La cantidad de procesos de trabajo de G.1X utilizados para la ejecución. El valor predeterminado es 5.

  • Timeout: número (entero), como mínimo 1.

    El tiempo de espera durante una ejecución en minutos. Es el tiempo máximo que una ejecución puede consumir recursos antes de que se termine y cambie al estado TIMEOUT. El valor predeterminado es 2880 minutos (48 horas).

  • ClientToken: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Se usa para la idempotencia y se recomienda establecerlo en un identificador aleatorio (como un UUID) para evitar crear o iniciar varias instancias del mismo recurso.

  • AdditionalRunOptions: objeto DataQualityEvaluationRunAdditionalRunOptions.

    Opciones de ejecución adicionales que puede especificar para una ejecución de evaluación.

  • RulesetNames: obligatorio: matriz de cadenas UTF-8, con una cadena como mínimo y 10 cadenas como máximo.

    Lista de nombres de conjuntos de reglas.

Respuesta
  • RunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

Errores
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRulesetEvaluationRun Acción (Python: cancel_data_quality_run)

Cancela una ejecución en la que se evalúa un conjunto de reglas con respecto a un origen de datos.

Solicitud
  • RunId: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRulesetEvaluationRun Acción (Python: get_data_quality_run)

Recupera una ejecución específica en la que se evalúa un conjunto de reglas con respecto a un origen de datos.

Solicitud
  • RunId: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

Respuesta
  • RunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

  • DataSource: objeto DataSource.

    El origen de datos (una tabla de AWS Glue) asociado a esta ejecución de evaluación.

  • Role: cadena UTF-8.

    Un rol de IAM que se proporciona para cifrar los resultados de la ejecución.

  • NumberOfWorkers: número (entero).

    La cantidad de procesos de trabajo de G.1X utilizados para la ejecución. El valor predeterminado es 5.

  • Timeout: número (entero), como mínimo 1.

    El tiempo de espera durante una ejecución en minutos. Es el tiempo máximo que una ejecución puede consumir recursos antes de que se termine y cambie al estado TIMEOUT. El valor predeterminado es 2880 minutos (48 horas).

  • AdditionalRunOptions: objeto DataQualityEvaluationRunAdditionalRunOptions.

    Opciones de ejecución adicionales que puede especificar para una ejecución de evaluación.

  • Status: cadena UTF-8 (valores válidos: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    El estado de esta ejecución.

  • ErrorString: cadena UTF-8.

    Las cadenas de error asociadas a la ejecución.

  • StartedOn: marca temporal.

    La fecha y la hora en las que se inició esta ejecución.

  • LastModifiedOn: marca temporal.

    Una marca temporal. El último momento dado en el que se modificó esta ejecución de recomendación de la regla de calidad de datos.

  • CompletedOn: marca temporal.

    La fecha y la hora en las que se completó esta ejecución.

  • ExecutionTime: número (entero).

    El tiempo (en segundos) que la ejecución de flujo de trabajo consumió recursos.

  • RulesetNames: matriz de cadenas UTF-8, con una cadena como mínimo y 10 cadenas como máximo.

    Lista de los nombres de los conjuntos de reglas para la ejecución.

  • ResultIds: matriz de cadenas UTF-8, con una cadena como mínimo y 10 cadenas como máximo.

    Una lista de ID de los resultados de calidad de datos de la ejecución.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesetEvaluationRuns Acción (Python: list_data_quality_runs)

Muestra todas las ejecuciones que cumplen los criterios del filtro, donde un conjunto de reglas se evalúa en relación con un origen de datos.

Solicitud
  • Filter: objeto DataQualityRulesetEvaluationRunFilter.

    Los criterios del filtro.

  • NextToken: cadena UTF-8.

    Un token paginado para compensar los resultados.

  • MaxResults: número (entero) que no es inferior a 1 ni es superior a 1000.

    El número máximo de resultados que devolver.

Respuesta
  • Runs: matriz de objetos DataQualityRulesetEvaluationRunDescription.

    Una lista de objetos DataQualityRulesetEvaluationRunDescription que representa las ejecuciones de un conjunto de reglas de calidad de datos.

  • NextToken: cadena UTF-8.

    Un token de paginación, si hay disponibles más resultados.

Errores
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartDataQualityRuleRecommendationRun Acción (Python: start_data_quality_run)

Inicia una ejecución de recomendación que se utiliza para generar reglas cuando no sabe qué reglas escribir. AWS Glue Calidad de datos analiza los datos y presenta recomendaciones para un posible conjunto de reglas. A continuación, puede clasificar el conjunto de reglas y modificar el conjunto de reglas generado a su gusto.

Solicitud
  • DataSource: obligatorio: objeto DataSource.

    El origen de datos (tabla de AWS Glue) asociado a esta ejecución.

  • RoleObligatorio: cadena UTF-8.

    Un rol de IAM que se proporciona para cifrar los resultados de la ejecución.

  • NumberOfWorkers: número (entero).

    La cantidad de procesos de trabajo de G.1X utilizados para la ejecución. El valor predeterminado es 5.

  • Timeout: número (entero), como mínimo 1.

    El tiempo de espera durante una ejecución en minutos. Es el tiempo máximo que una ejecución puede consumir recursos antes de que se termine y cambie al estado TIMEOUT. El valor predeterminado es 2880 minutos (48 horas).

  • CreatedRulesetName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Un nombre para el conjunto de reglas.

  • ClientToken: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Se usa para la idempotencia y se recomienda establecerlo en un identificador aleatorio (como un UUID) para evitar crear o iniciar varias instancias del mismo recurso.

Respuesta
  • RunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

Errores
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRuleRecommendationRun Acción (Python: cancel_data_quality_run)

Cancela la ejecución de recomendación especificada que se utilizó para generar las reglas.

Solicitud
  • RunId: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleRecommendationRun Acción (Python: get_data_quality_run)

Obtiene la ejecución de recomendación especificada que se utilizó para generar las reglas.

Solicitud
  • RunId: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

Respuesta
  • RunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución único asociado a esta ejecución.

  • DataSource: objeto DataSource.

    El origen de datos (una tabla de AWS Glue) asociado a esta ejecución.

  • Role: cadena UTF-8.

    Un rol de IAM que se proporciona para cifrar los resultados de la ejecución.

  • NumberOfWorkers: número (entero).

    La cantidad de procesos de trabajo de G.1X utilizados para la ejecución. El valor predeterminado es 5.

  • Timeout: número (entero), como mínimo 1.

    El tiempo de espera durante una ejecución en minutos. Es el tiempo máximo que una ejecución puede consumir recursos antes de que se termine y cambie al estado TIMEOUT. El valor predeterminado es 2880 minutos (48 horas).

  • Status: cadena UTF-8 (valores válidos: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    El estado de esta ejecución.

  • ErrorString: cadena UTF-8.

    Las cadenas de error asociadas a la ejecución.

  • StartedOn: marca temporal.

    La fecha y la hora en las que se inició esta ejecución.

  • LastModifiedOn: marca temporal.

    Una marca temporal. El último momento dado en el que se modificó esta ejecución de recomendación de la regla de calidad de datos.

  • CompletedOn: marca temporal.

    La fecha y la hora en las que se completó esta ejecución.

  • ExecutionTime: número (entero).

    El tiempo (en segundos) que la ejecución de flujo de trabajo consumió recursos.

  • RecommendedRuleset: cadena UTF-8, con 1 byte de largo como mínimo o 65 536 como máximo.

    Cuando se completa una ejecución de recomendación de reglas de inicio, se crea un conjunto de reglas recomendado (un conjunto de reglas). Este miembro tiene esas reglas en formato de lenguaje de definición de calidad de datos (DQDL).

  • CreatedRulesetName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del conjunto de reglas que se creó durante la ejecución.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRuleRecommendationRuns Acción (Python: list_data_quality_runs)

Muestra las ejecuciones de recomendación que cumplen los criterios del filtro.

Solicitud
  • Filter: objeto DataQualityRuleRecommendationRunFilter.

    Los criterios del filtro.

  • NextToken: cadena UTF-8.

    Un token paginado para compensar los resultados.

  • MaxResults: número (entero) que no es inferior a 1 ni es superior a 1000.

    El número máximo de resultados que devolver.

Respuesta
  • Runs: matriz de objetos DataQualityRuleRecommendationRunDescription.

    Una lista de objetos DataQualityRuleRecommendationRunDescription.

  • NextToken: cadena UTF-8.

    Un token de paginación, si hay disponibles más resultados.

Errores
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityResult Acción (Python: get_data_quality_result)

Recupera el resultado de una evaluación de la regla de calidad de datos.

Solicitud
  • ResultId: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Un identificador de resultado único para el resultado de la calidad de los datos.

Respuesta
  • ResultId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Un identificador de resultado único para el resultado de la calidad de los datos.

  • Score: número (doble), 1,0 como máximo.

    Una puntuación agregada de la calidad de los datos. Representa la relación entre las reglas aprobadas y la cantidad total de reglas.

  • DataSource: objeto DataSource.

    La tabla asociada al resultado de calidad de datos, si existe.

  • RulesetName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del conjunto de reglas asociado al resultado de calidad de datos.

  • EvaluationContext: cadena UTF-8.

    En relación con un trabajo en AWS Glue Studio, a cada nodo del lienzo se le suele asignar algún tipo de nombre y los nodos de calidad de datos tendrán nombres. En el caso de varios nodos, evaluationContext puede diferenciar los nodos.

  • StartedOn: marca temporal.

    La fecha y la hora en las que se inició la ejecución de este resultado de calidad de datos.

  • CompletedOn: marca temporal.

    La fecha y la hora en las que se completó la ejecución de este resultado de calidad de datos.

  • JobName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del trabajo asociado al resultado de calidad de datos, si existe.

  • JobRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID de la ejecución del trabajo asociado al resultado de calidad de datos, si existe.

  • RulesetEvaluationRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID único de ejecución asociado a la evaluación del conjunto de reglas.

  • RuleResults: una matriz de objetos DataQualityRuleResult, con 1 estructura como mínimo y 2000 estructuras como máximo.

    Una lista de objetos DataQualityRuleResult que representan los resultados de cada regla.

Errores
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • EntityNotFoundException

BatchGetDataQualityResult Acción (Python: batch_data_quality_result)

Recupera una lista de los resultados de calidad de datos para los ID de los resultados especificados.

Solicitud
  • ResultIds: obligatorio: matriz de cadenas UTF-8, con una cadena como mínimo y 100 cadenas como máximo.

    Una lista de identificadores únicos de los resultados de los resultados de calidad de datos.

Respuesta
  • Results (obligatorio): una matriz de objetos DataQualityResult.

    Una lista de objetos DataQualityResult que representa los resultados de calidad de datos.

  • ResultsNotFound: matriz de cadenas UTF-8, con una cadena como mínimo y 100 cadenas como máximo.

    Una lista de ID de los resultados para los que no se encontraron resultados.

Errores
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityResults Acción (Python: list_data_quality_results)

Devuelve todos los resultados de la ejecución de calidad de datos de su cuenta.

Solicitud
  • Filter: objeto DataQualityResultFilterCriteria.

    Los criterios del filtro.

  • NextToken: cadena UTF-8.

    Un token paginado para compensar los resultados.

  • MaxResults: número (entero) que no es inferior a 1 ni es superior a 1000.

    El número máximo de resultados que devolver.

Respuesta
  • Results (obligatorio): una matriz de objetos DataQualityResultDescription.

    Una lista de objetos DataQualityResultDescription.

  • NextToken: cadena UTF-8.

    Un token de paginación, si hay disponibles más resultados.

Errores
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

CreateDataQualityRuleset Acción (Python: create_data_quality_ruleset)

Crea un conjunto de reglas de la calidad de los datos con reglas de DQDL aplicadas a una tabla de AWS Glue especificada.

El conjunto de reglas se crea mediante lenguaje de definición de calidad de datos (DQDL). Para más información, consulte la Guía para desarrolladores de AWS Glue.

Solicitud
  • Name: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre único para el conjunto de reglas de la calidad de los datos.

  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Una descripción del conjunto de reglas de calidad de datos.

  • Ruleset: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 65 536 como máximo.

    Conjunto de reglas de lenguaje de definición de calidad de datos (DQDL). Para más información, consulte la Guía para desarrolladores de AWS Glue.

  • Tags: matriz de mapas de pares de clave-valor, con 50 pares como máximo.

    Cada clave es una cadena UTF-8 con una longitud de entre 1 y 128 bytes.

    Cada valor es una cadena UTF-8 que no tiene más de 256 bytes de largo.

    Una lista de etiquetas aplicadas al conjunto de reglas de calidad de datos.

  • TargetTable: objeto DataQualityTargetTable.

    Una tabla de destino asociada al conjunto de reglas de calidad de datos.

  • RecommendationRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Un identificador único de ejecución para la ejecución de recomendación.

  • ClientToken: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Se usa para la idempotencia y se recomienda establecerlo en un identificador aleatorio (como un UUID) para evitar crear o iniciar varias instancias del mismo recurso.

Respuesta
  • Name: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre único para el conjunto de reglas de la calidad de los datos.

Errores
  • InvalidInputException

  • AlreadyExistsException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

DeleteDataQualityRuleset Acción (Python: delete_data_quality_ruleset)

Elimina un conjunto de reglas de la calidad de los datos.

Solicitud
  • Name: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Un nombre para el conjunto de reglas de calidad de datos.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleset Acción (Python: get_data_quality_ruleset)

Devuelve un conjunto de reglas existente por identificador o nombre.

Solicitud
  • Name: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del conjunto de reglas.

Respuesta
  • Name: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del conjunto de reglas.

  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Una descripción del conjunto de reglas.

  • Ruleset: cadena UTF-8, con 1 byte de largo como mínimo o 65 536 como máximo.

    Conjunto de reglas de lenguaje de definición de calidad de datos (DQDL). Para más información, consulte la Guía para desarrolladores de AWS Glue.

  • TargetTable: objeto DataQualityTargetTable.

    El nombre de la base de datos y el nombre de la tabla de destino.

  • CreatedOn: marca temporal.

    Una marca temporal. La fecha y la hora en las que se creó este conjunto de reglas de calidad de datos.

  • LastModifiedOn: marca temporal.

    Una marca temporal. El último momento dado en el que se modificó este conjunto de reglas de calidad de datos.

  • RecommendationRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cuando se crea un conjunto de reglas a partir de una ejecución de recomendación, se genera este ID de ejecución para vincularlos ambos.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesets Acción (Python: list_data_quality_rulesets)

Devuelve una lista paginada de los conjuntos de reglas para la lista especificada de tablas de AWS Glue.

Solicitud
  • NextToken: cadena UTF-8.

    Un token paginado para compensar los resultados.

  • MaxResults: número (entero) que no es inferior a 1 ni es superior a 1000.

    El número máximo de resultados que devolver.

  • Filter: objeto DataQualityRulesetFilterCriteria.

    Los criterios del filtro.

  • Tags: matriz de mapas de pares de clave-valor, con 50 pares como máximo.

    Cada clave es una cadena UTF-8 con una longitud de entre 1 y 128 bytes.

    Cada valor es una cadena UTF-8 que no tiene más de 256 bytes de largo.

    Una lista de etiquetas de par clave-valor.

Respuesta
  • Rulesets: matriz de objetos DataQualityRulesetListDetails.

    Una lista paginada de los conjuntos de reglas para la lista especificada de tablas de AWS Glue.

  • NextToken: cadena UTF-8.

    Un token de paginación, si hay disponibles más resultados.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

UpdateDataQualityRuleset Acción (Python: update_data_quality_ruleset)

Actualiza el conjunto de reglas de calidad de datos especificado.

Solicitud
  • Name: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del conjunto de reglas de calidad de datos.

  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Una descripción del conjunto de reglas.

  • Ruleset: cadena UTF-8, con 1 byte de largo como mínimo o 65 536 como máximo.

    Conjunto de reglas de lenguaje de definición de calidad de datos (DQDL). Para más información, consulte la Guía para desarrolladores de AWS Glue.

Respuesta
  • Name: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del conjunto de reglas de calidad de datos.

  • Description: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Una descripción del conjunto de reglas.

  • Ruleset: cadena UTF-8, con 1 byte de largo como mínimo o 65 536 como máximo.

    Conjunto de reglas de lenguaje de definición de calidad de datos (DQDL). Para más información, consulte la Guía para desarrolladores de AWS Glue.

Errores
  • EntityNotFoundException

  • AlreadyExistsException

  • IdempotentParameterMismatchException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException