CreateDataset - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CreateDataset

创建新的 DataBrew 数据集。

请求语法

POST /datasets HTTP/1.1 Content-type: application/json { "Format": "string", "FormatOptions": { "Csv": { "Delimiter": "string", "HeaderRow": boolean }, "Excel": { "HeaderRow": boolean, "SheetIndexes": [ number ], "SheetNames": [ "string" ] }, "Json": { "MultiLine": boolean } }, "Input": { "DatabaseInputDefinition": { "DatabaseTableName": "string", "GlueConnectionName": "string", "QueryString": "string", "TempDirectory": { "Bucket": "string", "BucketOwner": "string", "Key": "string" } }, "DataCatalogInputDefinition": { "CatalogId": "string", "DatabaseName": "string", "TableName": "string", "TempDirectory": { "Bucket": "string", "BucketOwner": "string", "Key": "string" } }, "Metadata": { "SourceArn": "string" }, "S3InputDefinition": { "Bucket": "string", "BucketOwner": "string", "Key": "string" } }, "Name": "string", "PathOptions": { "FilesLimit": { "MaxFiles": number, "Order": "string", "OrderedBy": "string" }, "LastModifiedDateCondition": { "Expression": "string", "ValuesMap": { "string" : "string" } }, "Parameters": { "string" : { "CreateColumn": boolean, "DatetimeOptions": { "Format": "string", "LocaleCode": "string", "TimezoneOffset": "string" }, "Filter": { "Expression": "string", "ValuesMap": { "string" : "string" } }, "Name": "string", "Type": "string" } } }, "Tags": { "string" : "string" } }

URI 请求参数

该请求不使用任何 URI 参数。

请求体

请求接受采用 JSON 格式的以下数据。

Input

表示有关 DataBrew 如何在 Amazon S3 AWS Glue Data Catalog 或 Amazon S3 中查找数据的信息。

类型:Input 对象

必需:是

Name

要创建的数据集的名称。有效字符包括字母数字(A-Z、a-z、0-9)、连字符 (-)、句点 (.) 和空格。

类型:字符串

长度限制:长度下限为 1。最大长度为 255。

必需:是

Format

从 Amazon S3 文件或文件夹创建的数据集的文件格式。

类型:字符串

有效值:CSV | JSON | PARQUET | EXCEL | ORC

必需:否

FormatOptions

表示一组选项,这些选项用于定义逗号分隔值 (CSV)、Excel 或 JSON 输入的结构。

类型:FormatOptions 对象

必需:否

PathOptions

一组选项,用于定义如何 DataBrew 解释数据集的 Amazon S3 路径。

类型:PathOptions 对象

必需:否

Tags

要应用于此数据集的元数据标签。

类型:字符串到字符串映射

地图条目:最大数量为 200 个项目。

密钥长度限制:最小长度为 1。长度上限为 128。

值长度限制:最大长度为 256。

必需:否

响应语法

HTTP/1.1 200 Content-type: application/json { "Name": "string" }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回以下数据。

Name

您创建的数据集的名称。

类型:字符串

长度限制:长度下限为 1。最大长度为 255。

错误

有关所有操作的常见错误信息,请参阅常见错误

AccessDeniedException

对指定资源的访问被拒绝。

HTTP 状态代码:403

ConflictException

更新或删除资源可能会导致状态不一致。

HTTP 状态代码:409

ServiceQuotaExceededException

超过了服务配额。

HTTP 状态代码:402

ValidationException

此请求的输入参数未通过验证。

HTTP 状态代码:400

另请参阅

有关在特定语言的 AWS SDK 中使用此 API 的更多信息,请参阅以下内容: