本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
数据质量 API
数据质量API描述了数据质量数据类型,包括API用于创建、删除或更新数据质量规则集、运行和评估的。
数据类型
DataSource 结构
要获得数据质量结果的数据源( AWS Glue 表)。
字段
-
GlueTable
– 必填:一个 GlueTable 对象。一张 AWS Glue 桌子。
DataQualityRulesetListDetails 结构
描述 GetDataQualityRuleset
返回的数据质量规则集。
字段
-
Name
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern数据质量规则集的名称。
-
Description
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。数据质量规则集的描述。
-
CreatedOn
– 时间戳。创建数据质量规则集的日期和时间。
-
LastModifiedOn
– 时间戳。上次修改数据质量规则集的日期和时间。
-
TargetTable
– 一个 DataQualityTargetTable 对象。一个表示 AWS Glue 表格的对象。
-
RecommendationRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern当根据建议运行创建规则集时,会生成此运行 ID 以将两者联系在一起。
-
RuleCount
– 数字(整数)。规则集中的规则数量。
DataQualityTargetTable 结构
一个表示 AWS Glue 表格的对象。
字段
-
TableName
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string patternAWS Glue 表的名称。
-
DatabaseName
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern该 AWS Glue 表所在的数据库的名称。
-
CatalogId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern表所在的 AWS Glue 目录 ID。
DataQualityRulesetEvaluationRunDescription 结构
描述数据质量规则集评估运行的结果。
字段
-
RunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与此运行关联的唯一运行标识符。
-
Status
— UTF -8 字符串(有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
FAILED
|TIMEOUT
)。此运行的运行状态。
-
StartedOn
– 时间戳。启动运行的日期和时间。
-
DataSource
– 一个 DataSource 对象。与运行相关的数据源( AWS Glue 表)。
DataQualityRulesetEvaluationRunFilter 结构
筛选条件。
字段
-
DataSource
– 必填:一个 DataSource 对象。根据与运行关联的数据源( AWS Glue 表)进行筛选。
-
StartedBefore
– 时间戳。按在此时间之前开始的运行筛选结果。
-
StartedAfter
– 时间戳。按在此时间之后开始的运行筛选结果。
DataQualityEvaluationRunAdditionalRunOptions 结构
您可以为评估运行指定的其他运行选项。
字段
-
CloudWatchMetricsEnabled
– 布尔值。是否启用 CloudWatch 指标。
-
ResultsS3Prefix
— UTF -8 字符串。用于存储结果的 Amazon S3 的前缀。
-
CompositeRuleEvaluationMethod
— UTF -8 字符串(有效值:COLUMN
|ROW
)。将规则集中复合规则的评估方法设置为/ROWCOLUMN
DataQualityRuleRecommendationRunDescription 结构
描述数据质量规则建议运行的结果。
字段
-
RunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与此运行关联的唯一运行标识符。
-
Status
— UTF -8 字符串(有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
FAILED
|TIMEOUT
)。此运行的运行状态。
-
StartedOn
– 时间戳。此运行开始的日期和时间。
-
DataSource
– 一个 DataSource 对象。与建议运行关联的数据源(AWS Glue 表)。
DataQualityRuleRecommendationRunFilter 结构
用于列出数据质量建议运行的筛选器。
字段
-
DataSource
– 必填:一个 DataSource 对象。根据指定的数据源(AWS Glue 表)进行筛选。
-
StartedBefore
– 时间戳。根据时间进行筛选,以查看在提供的时间之前开始的结果。
-
StartedAfter
– 时间戳。根据时间进行筛选,以查看在提供的时间之后开始的结果。
DataQualityResult 结构
描述数据质量结果。
字段
-
ResultId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern数据质量结果的唯一结果 ID。
-
ProfileId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern数据质量结果的配置文件 ID。
-
Score
– 数字(双数),不超过 1.0。汇总的数据质量分数。表示规则与传递到规则总数的比率。
-
DataSource
– 一个 DataSource 对象。与数据质量结果相关的表(如果有)。
-
RulesetName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与数据质量结果相关的规则集的名称。
-
EvaluationContext
— UTF -8 字符串。在 AWS Glue Studio 的作业环境中,通常会为画布中的每个节点分配某种名称,并且数据质量节点会有名称。如果有多个节点,则
evaluationContext
可以区分这些节点。 -
StartedOn
– 时间戳。此数据质量运行开始的日期和时间。
-
CompletedOn
– 时间戳。此数据质量运行完成的日期和时间。
-
JobName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与数据质量结果相关的作业名称(如果有)。
-
JobRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与数据质量结果相关的作业运行 ID(如果有)。
-
RulesetEvaluationRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern此数据质量结果的规则集评估的唯一运行 ID。
-
RuleResults
– 一组 DataQualityRuleResult 对象,不超过 2000 个结构。代表每条规则结果的
DataQualityRuleResult
对象列表。 -
AnalyzerResults
– 一组 DataQualityAnalyzerResult 对象,不超过 2000 个结构。代表每个分析器结果的
DataQualityAnalyzerResult
对象列表。 -
Observations
– DataQualityObservation 对象的数组,不超过 50 个结构。代表评估规则和分析器后生成的观测值的
DataQualityObservation
对象列表。
DataQualityAnalyzerResult 结构
描述数据质量分析器评估的结果。
字段
-
Name
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern数据质量分析器的名称。
-
Description
— UTF -8 个字符串,长度不超过 2048 字节,与. URI address multi-line string pattern数据质量分析器的描述。
-
EvaluationMessage
— UTF -8 个字符串,长度不超过 2048 字节,与. URI address multi-line string pattern评估消息。
-
EvaluatedMetrics
– 键值对的映射数组。每个密钥都是一个 UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern
每个值都是数字(双精度数)。
与分析器评估相关的指标地图。
DataQualityObservation 结构
描述评估规则和分析器后生成的观测。
字段
-
Description
— UTF -8 个字符串,长度不超过 2048 字节,与. URI address multi-line string pattern数据质量观测的描述。
-
MetricBasedObservation
– 一个 MetricBasedObservation 对象。表示基于所评估数据质量指标的观测的
MetricBasedObservation
类型对象。
MetricBasedObservation 结构
描述基于所评估数据质量指标生成的基于指标的观测。
字段
-
MetricName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern用于生成观测的数据质量指标的名称。
-
StatisticId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern统计信息 ID。
-
MetricValues
– 一个 DataQualityMetricValues 对象。表示数据质量指标值分析的
DataQualityMetricValues
类型对象。 -
NewRules
— 由 UTF -8 个字符串组成的数组。根据数据质量指标值,作为观测结果的一部分生成的新数据质量规则列表。
DataQualityMetricValues 结构
根据对历史数据的分析,描述数据质量指标值。
字段
-
ActualValue
– 数字(double)。数据质量指标的实际值。
-
ExpectedValue
– 数字(double)。根据对历史数据的分析,数据质量指标的预期值。
-
LowerLimit
– 数字(double)。根据对历史数据的分析,数据质量指标的下限值。
-
UpperLimit
– 数字(double)。根据对历史数据的分析,数据质量指标的上限值。
DataQualityRuleResult 结构
描述数据质量规则评估运行的结果。
字段
-
Name
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern数据质量规则的名称。
-
Description
— UTF -8 个字符串,长度不超过 2048 字节,与. URI address multi-line string pattern数据质量规则的描述。
-
EvaluationMessage
— UTF -8 个字符串,长度不超过 2048 字节,与. URI address multi-line string pattern评估消息。
-
Result
— UTF -8 字符串(有效值:PASS
|FAIL
|ERROR
)。规则的通过或失败状态。
-
EvaluatedMetrics
– 键值对的映射数组。每个密钥都是一个 UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern
每个值都是数字(双精度数)。
与规则评估相关的指标地图。
-
EvaluatedRule
— UTF -8 个字符串,长度不超过 2048 字节,与. URI address multi-line string pattern已评估的规则。
DataQualityResultDescription 结构
描述数据质量结果。
字段
-
ResultId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern此数据质量结果的唯一结果 ID。
-
DataSource
– 一个 DataSource 对象。与数据质量结果相关的表。
-
JobName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与数据质量结果相关的作业名称。
-
JobRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与数据质量结果相关的作业运行 ID。
-
StartedOn
– 时间戳。此数据质量结果的运行开始的时间。
DataQualityResultFilterCriteria 结构
用于返回数据质量结果的标准。
字段
-
DataSource
– 一个 DataSource 对象。按指定的数据源筛选结果。例如,检索 AWS Glue 表的所有结果。
-
JobName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern按指定的任务名称筛选结果。
-
JobRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern按指定的任务运行 ID 筛选结果。
-
StartedAfter
– 时间戳。按在此时间之后开始的运行筛选结果。
-
StartedBefore
– 时间戳。按在此时间之前开始的运行筛选结果。
DataQualityRulesetFilterCriteria 结构
用于筛选数据质量规则集的条件。
字段
-
Name
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern规则集筛选条件的名称。
-
Description
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。规则集筛选条件的描述。
-
CreatedBefore
– 时间戳。筛选在此日期之前创建的规则集。
-
CreatedAfter
– 时间戳。筛选在此日期之后创建的规则集。
-
LastModifiedBefore
– 时间戳。筛选此日期之前最后一次修改的规则集。
-
LastModifiedAfter
– 时间戳。筛选此日期之后最后一次修改的规则集。
-
TargetTable
– 一个 DataQualityTargetTable 对象。目标表的名称和数据库名称。
StatisticAnnotation 结构
统计注释。
字段
-
ProfileId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern个人资料 ID。
-
StatisticId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern统计信息 ID。
-
StatisticRecordedOn
– 时间戳。记录带注释的统计数据的时间戳。
-
InclusionAnnotation
– 一个 TimestampedInclusionAnnotation 对象。应用于统计数据的包含注释。
TimestampedInclusionAnnotation 结构
带有时间戳的包含注释。
字段
-
Value
— UTF -8 字符串(有效值:INCLUDE
|EXCLUDE
)。包含注释值。
-
LastModifiedOn
– 时间戳。上次修改包含注释的时间戳。
AnnotationError 结构
注释失败。
字段
-
ProfileId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern失败注释的配置文件 ID。
-
StatisticId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern失败注释的统计 ID。
-
FailureReason
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。注释失败的原因。
DatapointInclusionAnnotation 结构
包含注释。
字段
-
ProfileId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern统计数据所属的数据质量配置文件的 ID。
-
StatisticId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern统计信息 ID。
-
InclusionAnnotation
— UTF -8 字符串(有效值:INCLUDE
|EXCLUDE
)。要应用于统计数据的包含注释值。
StatisticSummaryList 清单
StatisticSummary
列表。
StatisticSummary 对象数组。
StatisticSummary
列表。
StatisticSummary 结构
有关统计数据的摘要信息。
字段
-
StatisticId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern统计信息 ID。
-
ProfileId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern个人资料 ID。
-
RunIdentifier
– 一个 RunIdentifier 对象。运行标识符
-
StatisticName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Custom string pattern #32统计数据的名称。
-
DoubleValue
– 数字(double)。统计数据的值。
-
EvaluationLevel
— UTF -8 字符串(有效值:Dataset="DATASET"
|Column="COLUMN"
|Multicolumn="MULTICOLUMN"
)。统计数据的评估级别。可能的值:
Dataset
、Column
、Multicolumn
。 -
ColumnsReferenced
— 由 UTF -8 个字符串组成的数组。统计数据引用的列列表。
-
ReferencedDatasets
— 由 UTF -8 个字符串组成的数组。统计数据引用的数据集列表。
-
StatisticProperties
– 键值对的映射数组。每个密钥都是一个 UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern
每个值都是一个描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。
A
StatisticPropertiesMap
,其中包含 aNameString
和DescriptionString
-
RecordedOn
– 时间戳。记录统计数据的时间戳。
-
InclusionAnnotation
– 一个 TimestampedInclusionAnnotation 对象。统计数据的包含注释。
RunIdentifier 结构
运行标识符。
字段
-
RunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern运行 ID。
-
JobRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string patternJob 运行 ID。
StatisticModelResult 结构
统计模型结果。
字段
-
LowerBound
– 数字(double)。下限。
-
UpperBound
– 数字(double)。上限。
-
PredictedValue
– 数字(double)。预测值。
-
ActualValue
– 数字(double)。实际值。
-
Date
– 时间戳。日期。
-
InclusionAnnotation
— UTF -8 字符串(有效值:INCLUDE
|EXCLUDE
)。包含注释。
操作
StartDataQualityRulesetEvaluationRun 操作(Python:start_data_quality_ruleset_evaluation_run)
CancelDataQualityRulesetEvaluationRun 操作(Python:取消_data_quality_ruleset_requalition_run)
GetDataQualityRulesetEvaluationRun 操作(Python:get_data_quality_ruleset_requalition_run)
ListDataQualityRulesetEvaluationRuns 操作(Python:list_data_quality_ruleset_requalition_runs)
StartDataQualityRuleRecommendationRun 动作(Python:start_data_quality_rule_rule_remuldation_
CancelDataQualityRuleRecommendationRun 操作(Python:取消数据质量规则_推荐_运行)
GetDataQualityRuleRecommendationRun action(Python:获取数据质量规则_推荐_运行)
ListDataQualityRuleRecommendationRuns action(Python:list_data_quality_rule_rule_runs)
BatchGetDataQualityResult 操作(Python:batch_get_data_quality_result)
CreateDataQualityRuleset 操作(Python:create_data_quality_ruleset)
DeleteDataQualityRuleset 操作(Python:delete_data_quality_ruleset)
BatchPutDataQualityStatisticAnnotation 操作(Python:batch_put_data_quality_statistic_annotations)
ListDataQualityStatisticAnnotations 操作(Python:列表_数据_质量_统计_注释)
PutDataQualityProfileAnnotation action(Python:put_data_quality_profile_n
StartDataQualityRulesetEvaluationRun 操作(Python:start_data_quality_ruleset_evaluation_run)
有了规则集定义(建议定义或您自己的规则)后,就可以调用此操作来根据数据源(表)评估规则集。AWS Glue 评估计算出您可以通过检索的GetDataQualityResult
API结果。
请求
-
DataSource
– 必填:一个 DataSource 对象。与此次运行相关的数据源(AWS Glue 表)。
-
Role
— 必填:UTF-8 字符串。为加密运行结果而提供的 IAM 角色。
-
NumberOfWorkers
– 数字(整数)。运行所用的
G.1X
工作线程数量。默认值为 5。 -
Timeout
- 数字(整数),至少为 1。运行超时(分钟)。这是任务运行在终止并进入
TIMEOUT
状态前可以使用资源的最长时间。默认值为 2880 分钟(48 小时)。 -
ClientToken
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern用于等性,建议将其设置为随机 ID(例如 aUUID),以避免创建或启动同一资源的多个实例。
-
AdditionalRunOptions
– 一个 DataQualityEvaluationRunAdditionalRunOptions 对象。您可以为评估运行指定的其他运行选项。
-
RulesetNames
— 必需:由 UTF -8 个字符串组成的数组,不少于 1 个或超过 10 个字符串。规则集名称的列表。
-
AdditionalDataSources
– 键值对的映射数组。每个密钥都是一个 UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern
每个值都是一个 DataSource 对象。
您可以为评估运行指定的其他数据来源的引用字符串地图。
响应
-
RunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与此运行关联的唯一运行标识符。
错误
InvalidInputException
EntityNotFoundException
OperationTimeoutException
InternalServiceException
ConflictException
CancelDataQualityRulesetEvaluationRun 操作(Python:取消_data_quality_ruleset_requalition_run)
取消正在根据数据源评估规则集的运行。
请求
-
RunId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern与此运行关联的唯一运行标识符。
响应
无响应参数。
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
GetDataQualityRulesetEvaluationRun 操作(Python:get_data_quality_ruleset_requalition_run)
检索正在根据数据源评估规则集的特定运行。
请求
-
RunId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern与此运行关联的唯一运行标识符。
响应
-
RunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与此运行关联的唯一运行标识符。
-
DataSource
– 一个 DataSource 对象。与此评估运行相关的数据源( AWS Glue 表)。
-
Role
— UTF -8 字符串。为加密运行结果而提供的 IAM 角色。
-
NumberOfWorkers
– 数字(整数)。运行所用的
G.1X
工作线程数量。默认值为 5。 -
Timeout
- 数字(整数),至少为 1。运行超时(分钟)。这是任务运行在终止并进入
TIMEOUT
状态前可以使用资源的最长时间。默认值为 2880 分钟(48 小时)。 -
AdditionalRunOptions
– 一个 DataQualityEvaluationRunAdditionalRunOptions 对象。您可以为评估运行指定的其他运行选项。
-
Status
— UTF -8 字符串(有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
FAILED
|TIMEOUT
)。此运行的运行状态。
-
ErrorString
— UTF -8 字符串。与运行关联的错误字符串。
-
StartedOn
– 时间戳。此运行开始的日期和时间。
-
LastModifiedOn
– 时间戳。时间戳。此数据质量规则建议运行最后一个修改时间点。
-
CompletedOn
– 时间戳。此运行的完成日期和时间。
-
ExecutionTime
– 数字(整数)。运行使用资源的时间长度(以秒为单位)。
-
RulesetNames
— 由 UTF -8 个字符串组成的数组,不少于 1 个或大于 10 个字符串。运行的规则集名称列表。目前,此参数仅采用一个规则集名称。
-
ResultIds
— 由 UTF -8 个字符串组成的数组,不少于 1 个或大于 10 个字符串。运行的数据质量结果的结果列表。IDs
-
AdditionalDataSources
– 键值对的映射数组。每个密钥都是一个 UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern
每个值都是一个 DataSource 对象。
您可以为评估运行指定的其他数据来源的引用字符串地图。
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
ListDataQualityRulesetEvaluationRuns 操作(Python:list_data_quality_ruleset_requalition_runs)
列出所有符合筛选条件的运行,其中根据数据源对规则集进行评估。
请求
-
Filter
– 一个 DataQualityRulesetEvaluationRunFilter 对象。筛选条件。
-
NextToken
— UTF -8 字符串。用于偏移结果的分页令牌。
-
MaxResults
– 数字(整数),不小于 1 或大于 1000。要返回的最大结果数量。
响应
-
Runs
– DataQualityRulesetEvaluationRunDescription 对象的数组。代表数据质量规则集规则的
DataQualityRulesetEvaluationRunDescription
对象列表。 -
NextToken
— UTF -8 字符串。分页令牌(如果有更多结果可用)。
错误
InvalidInputException
OperationTimeoutException
InternalServiceException
StartDataQualityRuleRecommendationRun 动作(Python:start_data_quality_rule_rule_remuldation_
当你不知道要写什么规则时,启动推荐运行,用于生成规则。 AWS Glue 数据质量分析数据,并针对潜在的规则集提出建议。然后,您可以对规则集进行分类,并根据自己的喜好修改生成的规则集。
建议运行在 90 天后被自动删除。
请求
数据质量规则建议请求的请求。
-
DataSource
– 必填:一个 DataSource 对象。与此次运行相关的数据源(AWS Glue 表)。
-
Role
— 必填:UTF-8 字符串。为加密运行结果而提供的 IAM 角色。
-
NumberOfWorkers
– 数字(整数)。运行所用的
G.1X
工作线程数量。默认值为 5。 -
Timeout
- 数字(整数),至少为 1。运行超时(分钟)。这是任务运行在终止并进入
TIMEOUT
状态前可以使用资源的最长时间。默认值为 2880 分钟(48 小时)。 -
CreatedRulesetName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern规则集的名称。
-
DataQualitySecurityConfiguration
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern使用数据质量加密选项创建的安全配置名称。
-
ClientToken
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern用于等性,建议将其设置为随机 ID(例如 aUUID),以避免创建或启动同一资源的多个实例。
响应
-
RunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与此运行关联的唯一运行标识符。
错误
InvalidInputException
OperationTimeoutException
InternalServiceException
ConflictException
CancelDataQualityRuleRecommendationRun 操作(Python:取消数据质量规则_推荐_运行)
取消用于生成规则的指定建议运行。
请求
-
RunId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern与此运行关联的唯一运行标识符。
响应
无响应参数。
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
GetDataQualityRuleRecommendationRun action(Python:获取数据质量规则_推荐_运行)
获取用于生成规则的指定建议运行。
请求
-
RunId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern与此运行关联的唯一运行标识符。
响应
运行对数据质量规则建议的响应。
-
RunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与此运行关联的唯一运行标识符。
-
DataSource
– 一个 DataSource 对象。与此运行相关的数据源( AWS Glue 表)。
-
Role
— UTF -8 字符串。为加密运行结果而提供的 IAM 角色。
-
NumberOfWorkers
– 数字(整数)。运行所用的
G.1X
工作线程数量。默认值为 5。 -
Timeout
- 数字(整数),至少为 1。运行超时(分钟)。这是任务运行在终止并进入
TIMEOUT
状态前可以使用资源的最长时间。默认值为 2880 分钟(48 小时)。 -
Status
— UTF -8 字符串(有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
FAILED
|TIMEOUT
)。此运行的运行状态。
-
ErrorString
— UTF -8 字符串。与运行关联的错误字符串。
-
StartedOn
– 时间戳。此运行开始的日期和时间。
-
LastModifiedOn
– 时间戳。时间戳。此数据质量规则建议运行最后一个修改时间点。
-
CompletedOn
– 时间戳。此运行的完成日期和时间。
-
ExecutionTime
– 数字(整数)。运行使用资源的时间长度(以秒为单位)。
-
RecommendedRuleset
— UTF -8 个字符串,长度不小于 1 或超过 65536 字节。启动规则建议运行完成后,它会创建建议的规则集(一组规则)。该成员具有数据质量定义语言 (DQDL) 格式的规则。
-
CreatedRulesetName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern运行创建的规则集的名称。
-
DataQualitySecurityConfiguration
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern使用数据质量加密选项创建的安全配置名称。
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
ListDataQualityRuleRecommendationRuns action(Python:list_data_quality_rule_rule_runs)
列出符合筛选条件的建议运行。
请求
-
Filter
– 一个 DataQualityRuleRecommendationRunFilter 对象。筛选条件。
-
NextToken
— UTF -8 字符串。用于偏移结果的分页令牌。
-
MaxResults
– 数字(整数),不小于 1 或大于 1000。要返回的最大结果数量。
响应
-
Runs
– DataQualityRuleRecommendationRunDescription 对象的数组。DataQualityRuleRecommendationRunDescription
对象的列表。 -
NextToken
— UTF -8 字符串。分页令牌(如果有更多结果可用)。
错误
InvalidInputException
OperationTimeoutException
InternalServiceException
GetDataQualityResult 操作(Python:获取数据质量结果)
检索数据质量规则评估的结果。
请求
-
ResultId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern数据质量结果的唯一结果 ID。
响应
对数据质量结果的响应。
-
ResultId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern数据质量结果的唯一结果 ID。
-
ProfileId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern数据质量结果的配置文件 ID。
-
Score
– 数字(双数),不超过 1.0。汇总的数据质量分数。表示规则与传递到规则总数的比率。
-
DataSource
– 一个 DataSource 对象。与数据质量结果相关的表(如果有)。
-
RulesetName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与数据质量结果相关的规则集的名称。
-
EvaluationContext
— UTF -8 字符串。在 AWS Glue Studio 的作业环境中,通常会为画布中的每个节点分配某种名称,并且数据质量节点会有名称。如果有多个节点,则
evaluationContext
可以区分这些节点。 -
StartedOn
– 时间戳。开始运行此数据质量结果的日期和时间。
-
CompletedOn
– 时间戳。完成运行此数据质量结果的日期和时间。
-
JobName
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与数据质量结果相关的作业名称(如果有)。
-
JobRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与数据质量结果相关的作业运行 ID(如果有)。
-
RulesetEvaluationRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern与规则集评估相关的唯一运行 ID。
-
RuleResults
– 一组 DataQualityRuleResult 对象,不超过 2000 个结构。代表每条规则结果的
DataQualityRuleResult
对象列表。 -
AnalyzerResults
– 一组 DataQualityAnalyzerResult 对象,不超过 2000 个结构。代表每个分析器结果的
DataQualityAnalyzerResult
对象列表。 -
Observations
– DataQualityObservation 对象的数组,不超过 50 个结构。代表评估规则和分析器后生成的观测值的
DataQualityObservation
对象列表。
错误
InvalidInputException
OperationTimeoutException
InternalServiceException
EntityNotFoundException
BatchGetDataQualityResult 操作(Python:batch_get_data_quality_result)
检索指定结果的数据质量结果列表。IDs
请求
-
ResultIds
— 必需:由 UTF -8 个字符串组成的数组,不少于 1 个或超过 100 个字符串。数据质量结果IDs的唯一结果列表。
响应
-
Results
– 必填:DataQualityResult 对象的数组。代表数据质量规则集的
DataQualityResult
对象列表。 -
ResultsNotFound
— 由 UTF -8 个字符串组成的数组,不少于 1 个或超过 100 个字符串。未找到结果IDs的结果列表。
错误
InvalidInputException
OperationTimeoutException
InternalServiceException
ListDataQualityResults 操作(Python:列表数据质量结果)
返回您账户的所有数据质量执行结果。
请求
-
Filter
– 一个 DataQualityResultFilterCriteria 对象。筛选条件。
-
NextToken
— UTF -8 字符串。用于偏移结果的分页令牌。
-
MaxResults
– 数字(整数),不小于 1 或大于 1000。要返回的最大结果数量。
响应
-
Results
– 必填:DataQualityResultDescription 对象的数组。DataQualityResultDescription
对象的列表。 -
NextToken
— UTF -8 字符串。分页令牌(如果有更多结果可用)。
错误
InvalidInputException
OperationTimeoutException
InternalServiceException
CreateDataQualityRuleset 操作(Python:create_data_quality_ruleset)
使用应用于指定 AWS Glue 表的DQDL规则创建数据质量规则集。
您可以使用数据质量定义语言 () DQDL 创建规则集。有关更多信息,请参阅 AWS Glue 开发者指南。
请求
创建数据质量规则集的请求。
-
Name
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern数据质量规则集的唯一名称。
-
Description
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。数据质量规则集的描述。
-
Ruleset
— 必填:UTF-8 个字符串,长度不小于 1 或超过 65536 字节。数据质量定义语言 (DQDL) 规则集。有关更多信息,请参阅 AWS Glue 开发者指南。
-
Tags
– 键值对的映射数组,不超过 50 对。每个密钥都是一个 UTF -8 字符串,长度不小于 1 或超过 128 字节。
每个值都是一个 UTF -8 字符串,长度不超过 256 字节。
应用于数据质量规则集的标签列表。
-
TargetTable
– 一个 DataQualityTargetTable 对象。与数据质量规则集关联的目标表。
-
RecommendationRunId
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern建议运行的唯一运行 ID。
-
DataQualitySecurityConfiguration
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern使用数据质量加密选项创建的安全配置名称。
-
ClientToken
— UTF -8 个字符串,长度不小于 1 或超过 255 个字节,与. Single-line string pattern用于等性,建议将其设置为随机 ID(例如 aUUID),以避免创建或启动同一资源的多个实例。
响应
-
Name
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern数据质量规则集的唯一名称。
错误
InvalidInputException
AlreadyExistsException
OperationTimeoutException
InternalServiceException
ResourceNumberLimitExceededException
DeleteDataQualityRuleset 操作(Python:delete_data_quality_ruleset)
删除数据质量规则集。
请求
-
Name
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern数据质量规则集的名称。
响应
无响应参数。
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
GetDataQualityRuleset 操作(Python:get_data_quality_ruleset)
按标识符或名称返回现有规则集。
请求
-
Name
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern规则集的名称。
响应
返回数据质量规则集响应。
-
Name
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern规则集的名称。
-
Description
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。规则集的描述。
-
Ruleset
— UTF -8 个字符串,长度不小于 1 或超过 65536 字节。数据质量定义语言 (DQDL) 规则集。有关更多信息,请参阅 AWS Glue 开发者指南。
-
TargetTable
– 一个 DataQualityTargetTable 对象。目标表的名称和数据库名称。
-
CreatedOn
– 时间戳。时间戳。此数据质量规则集的创建时间和日期。
-
LastModifiedOn
– 时间戳。时间戳。此数据质量规则最后一个修改时间点。
-
RecommendationRunId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern当根据建议运行创建规则集时,会生成此运行 ID 以将两者联系在一起。
-
DataQualitySecurityConfiguration
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern使用数据质量加密选项创建的安全配置名称。
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
ListDataQualityRulesets 操作(Python:列表数据质量规则集)
返回指定表列表的规则集的分页列表。 AWS Glue
请求
-
NextToken
— UTF -8 字符串。用于偏移结果的分页令牌。
-
MaxResults
– 数字(整数),不小于 1 或大于 1000。要返回的最大结果数量。
-
Filter
– 一个 DataQualityRulesetFilterCriteria 对象。筛选条件。
-
Tags
– 键值对的映射数组,不超过 50 对。每个密钥都是一个 UTF -8 字符串,长度不小于 1 或超过 128 字节。
每个值都是一个 UTF -8 字符串,长度不超过 256 字节。
键值对标签的列表。
响应
-
Rulesets
– DataQualityRulesetListDetails 对象的数组。指定表列表的规则集的分页列表。 AWS Glue
-
NextToken
— UTF -8 字符串。分页令牌(如果有更多结果可用)。
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
UpdateDataQualityRuleset 操作(Python:更新数据质量规则集)
更新指定的数据质量规则集。
请求
-
Name
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern数据质量规则集的名称。
-
Description
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。规则集的描述。
-
Ruleset
— UTF -8 个字符串,长度不小于 1 或超过 65536 字节。数据质量定义语言 (DQDL) 规则集。有关更多信息,请参阅 AWS Glue 开发者指南。
响应
-
Name
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern数据质量规则集的名称。
-
Description
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。规则集的描述。
-
Ruleset
— UTF -8 个字符串,长度不小于 1 或超过 65536 字节。数据质量定义语言 (DQDL) 规则集。有关更多信息,请参阅 AWS Glue 开发者指南。
错误
EntityNotFoundException
AlreadyExistsException
IdempotentParameterMismatchException
InvalidInputException
OperationTimeoutException
InternalServiceException
ResourceNumberLimitExceededException
ListDataQualityStatistics 操作(Python:列表数据质量统计)
检索数据质量统计信息列表。
请求
-
StatisticId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern统计信息 ID。
-
ProfileId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern个人资料 ID。
-
TimestampFilter
– 一个 TimestampFilter 对象。时间戳过滤器。
-
MaxResults
– 数字(整数),不小于 1 或大于 1000。此请求中要返回的最大结果数。
-
NextToken
— UTF -8 字符串。用于请求下一页结果的分页令牌。
响应
-
Statistics
– StatisticSummary 对象的数组。一个
StatisticSummaryList
。 -
NextToken
— UTF -8 字符串。用于请求下一页结果的分页令牌。
错误
EntityNotFoundException
InvalidInputException
InternalServiceException
TimestampFilter 结构
时间戳过滤器。
字段
-
RecordedBefore
– 时间戳。结果中应包含统计数据的时间戳。
-
RecordedAfter
– 时间戳。时间戳,超过该时间戳后应将统计数据包含在结果中。
CreateDataQualityRulesetRequest 结构
创建数据质量规则集的请求。
字段
-
Name
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern数据质量规则集的唯一名称。
-
Description
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。数据质量规则集的描述。
-
Ruleset
— 必填:UTF-8 个字符串,长度不小于 1 或超过 65536 字节。数据质量定义语言 (DQDL) 规则集。有关更多信息,请参阅 AWS Glue 开发者指南。
-
Tags
– 键值对的映射数组,不超过 50 对。每个密钥都是一个 UTF -8 字符串,长度不小于 1 或超过 128 字节。
每个值都是一个 UTF -8 字符串,长度不超过 256 字节。
应用于数据质量规则集的标签列表。
-
TargetTable
– 一个 DataQualityTargetTable 对象。与数据质量规则集关联的目标表。
-
RecommendationRunId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern建议运行的唯一运行 ID。
-
DataQualitySecurityConfiguration
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern使用数据质量加密选项创建的安全配置名称。
-
ClientToken
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern用于等性,建议将其设置为随机 ID(例如 aUUID),以避免创建或启动同一资源的多个实例。
GetDataQualityRulesetResponse 结构
返回数据质量规则集响应。
字段
-
Name
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern规则集的名称。
-
Description
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。规则集的描述。
-
Ruleset
— UTF -8 个字符串,长度不小于 1 或超过 65536 字节。数据质量定义语言 (DQDL) 规则集。有关更多信息,请参阅 AWS Glue 开发者指南。
-
TargetTable
– 一个 DataQualityTargetTable 对象。目标表的名称和数据库名称。
-
CreatedOn
– 时间戳。时间戳。此数据质量规则集的创建时间和日期。
-
LastModifiedOn
– 时间戳。时间戳。此数据质量规则最后一个修改时间点。
-
RecommendationRunId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern当根据建议运行创建规则集时,会生成此运行 ID 以将两者联系在一起。
-
DataQualitySecurityConfiguration
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern使用数据质量加密选项创建的安全配置名称。
GetDataQualityResultResponse 结构
对数据质量结果的响应。
字段
-
ResultId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern数据质量结果的唯一结果 ID。
-
ProfileId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern数据质量结果的配置文件 ID。
-
Score
– 数字(双数),不超过 1.0。汇总的数据质量分数。表示规则与传递到规则总数的比率。
-
DataSource
– 一个 DataSource 对象。与数据质量结果相关的表(如果有)。
-
RulesetName
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern与数据质量结果相关的规则集的名称。
-
EvaluationContext
— UTF -8 字符串。在 AWS Glue Studio 的作业环境中,通常会为画布中的每个节点分配某种名称,并且数据质量节点会有名称。如果有多个节点,则
evaluationContext
可以区分这些节点。 -
StartedOn
– 时间戳。开始运行此数据质量结果的日期和时间。
-
CompletedOn
– 时间戳。完成运行此数据质量结果的日期和时间。
-
JobName
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern与数据质量结果相关的作业名称(如果有)。
-
JobRunId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern与数据质量结果相关的作业运行 ID(如果有)。
-
RulesetEvaluationRunId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern与规则集评估相关的唯一运行 ID。
-
RuleResults
– 一组 DataQualityRuleResult 对象,不超过 2000 个结构。代表每条规则结果的
DataQualityRuleResult
对象列表。 -
AnalyzerResults
– 一组 DataQualityAnalyzerResult 对象,不超过 2000 个结构。代表每个分析器结果的
DataQualityAnalyzerResult
对象列表。 -
Observations
– DataQualityObservation 对象的数组,不超过 50 个结构。代表评估规则和分析器后生成的观测值的
DataQualityObservation
对象列表。
StartDataQualityRuleRecommendationRunRequest 结构
数据质量规则建议请求的请求。
字段
-
DataSource
– 必填:一个 DataSource 对象。与此次运行相关的数据源(AWS Glue 表)。
-
Role
— 必填:UTF-8 字符串。为加密运行结果而提供的 IAM 角色。
-
NumberOfWorkers
– 数字(整数)。运行所用的
G.1X
工作线程数量。默认值为 5。 -
Timeout
- 数字(整数),至少为 1。运行超时(分钟)。这是任务运行在终止并进入
TIMEOUT
状态前可以使用资源的最长时间。默认值为 2880 分钟(48 小时)。 -
CreatedRulesetName
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern规则集的名称。
-
DataQualitySecurityConfiguration
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern使用数据质量加密选项创建的安全配置名称。
-
ClientToken
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern用于等性,建议将其设置为随机 ID(例如 aUUID),以避免创建或启动同一资源的多个实例。
GetDataQualityRuleRecommendationRunResponse 结构
运行对数据质量规则建议的响应。
字段
-
RunId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern与此运行关联的唯一运行标识符。
-
DataSource
– 一个 DataSource 对象。与此运行相关的数据源( AWS Glue 表)。
-
Role
— UTF -8 字符串。为加密运行结果而提供的 IAM 角色。
-
NumberOfWorkers
– 数字(整数)。运行所用的
G.1X
工作线程数量。默认值为 5。 -
Timeout
- 数字(整数),至少为 1。运行超时(分钟)。这是任务运行在终止并进入
TIMEOUT
状态前可以使用资源的最长时间。默认值为 2880 分钟(48 小时)。 -
Status
— UTF -8 字符串(有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
FAILED
|TIMEOUT
)。此运行的运行状态。
-
ErrorString
— UTF -8 字符串。与运行关联的错误字符串。
-
StartedOn
– 时间戳。此运行开始的日期和时间。
-
LastModifiedOn
– 时间戳。时间戳。此数据质量规则建议运行最后一个修改时间点。
-
CompletedOn
– 时间戳。此运行的完成日期和时间。
-
ExecutionTime
– 数字(整数)。运行使用资源的时间长度(以秒为单位)。
-
RecommendedRuleset
— UTF -8 个字符串,长度不小于 1 或超过 65536 字节。启动规则建议运行完成后,它会创建建议的规则集(一组规则)。该成员具有数据质量定义语言 (DQDL) 格式的规则。
-
CreatedRulesetName
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern运行创建的规则集的名称。
-
DataQualitySecurityConfiguration
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern使用数据质量加密选项创建的安全配置名称。
BatchPutDataQualityStatisticAnnotation 操作(Python:batch_put_data_quality_statistic_annotations)
为特定数据质量统计数据随时间变化的数据点添加注释。
请求
-
InclusionAnnotations
– 必填:DatapointInclusionAnnotation 对象的数组。DatapointInclusionAnnotation
的清单. -
ClientToken
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern客户令牌。
响应
-
FailedInclusionAnnotations
– AnnotationError 对象的数组。AnnotationError
的清单.
错误
EntityNotFoundException
InvalidInputException
InternalServiceException
ResourceNumberLimitExceededException
GetDataQualityModel 操作(Python:获取数据质量模型)
检索模型的训练状态以及更多信息(CompletedOn、 StartedOn、 FailureReason)。
请求
-
StatisticId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern统计信息 ID。
-
ProfileId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern个人资料 ID。
响应
-
Status
— UTF -8 字符串(有效值:RUNNING
|SUCCEEDED
|FAILED
)。数据质量模型的训练状态。
-
StartedOn
– 时间戳。数据质量模型训练开始的时间戳。
-
CompletedOn
– 时间戳。数据质量模型训练完成的时间戳。
-
FailureReason
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern训练失败的原因。
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
GetDataQualityModelResult 操作(Python:获取数据质量模型结果)
检索统计数据对给定个人资料 ID 的预测。
请求
-
StatisticId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern统计信息 ID。
-
ProfileId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern个人资料 ID。
响应
-
CompletedOn
– 时间戳。数据质量模型训练完成的时间戳。
-
Model
– StatisticModelResult 对象的数组。清单
StatisticModelResult
错误
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
ListDataQualityStatisticAnnotations 操作(Python:列表_数据_质量_统计_注释)
检索数据质量统计数据的注释。
请求
-
StatisticId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern统计信息 ID。
-
ProfileId
— UTF -8 字符串,长度不小于 1 或超过 255 字节,与. Single-line string pattern个人资料 ID。
-
TimestampFilter
– 一个 TimestampFilter 对象。时间戳过滤器。
-
MaxResults
– 数字(整数),不小于 1 或大于 1000。此请求中要返回的最大结果数。
-
NextToken
— UTF -8 字符串。用于检索下一组结果的分页令牌。
响应
-
Annotations
– StatisticAnnotation 对象的数组。StatisticAnnotation
应用于统计数据的列表 -
NextToken
— UTF -8 字符串。用于检索下一组结果的分页令牌。
错误
InvalidInputException
InternalServiceException
PutDataQualityProfileAnnotation action(Python:put_data_quality_profile_n
为个人资料的所有数据点添加注释。
请求
-
ProfileId
— 必填:UTF-8 个字符串,长度不小于 1 或超过 255 字节,匹配。Single-line string pattern要注释的数据质量监控配置文件的 ID。
-
InclusionAnnotation
— 必填:UTF-8 字符串(有效值:INCLUDE
|EXCLUDE
)。要应用于配置文件的包含注释值。
响应
无响应参数。
错误
EntityNotFoundException
InvalidInputException
InternalServiceException