CreateDatasetImportJob - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

CreateDatasetImportJob

建立將訓練資料從資料來源 (Amazon S3 儲存貯體) 匯入 Amazon 個 Amazon Personalize 資料集的任務。若要允許 Amazon Personalize 匯入訓練資料,您必須指定具有從資料來源讀取權限的 IAM 服務角色,因為 Amazon Personalize 會複製您的資料並在內部處理。如需授與 Amazon S3 儲存貯體存取權的相關資訊,請參閱授予 Amazon Personalize 存取 Amazon S3 資源

如果您已經建立推薦人或部署了含有促銷活動的自訂解決方案版本,則新的大量記錄對建議的影響程度取決於您使用的網域使用案例或方案。如需詳細資訊,請參閱新資料如何影響即時建議

重要

根據預設,資料集匯入工作會取代您大量匯入之資料集中的任何現有資料。若要在不取代現有資料的情況下新增記錄,請在 CreateDatasetImportJob 作業中為匯入模式指定增量。

狀態

資料集匯入任務可處於下列任意一種狀態:

  • CREATE PENDING > CREATE IN_PROGRESS > ACTIVE -or- CREATE FAILED

若要取得匯入任務的狀態,請撥打電話 DescribeDatasetImportJob,並提供資料集匯入任務的 Amazon 資源名稱 (ARN)。當狀態顯示為 ACTIVE 時,即表示資料集匯入完成。如果狀態顯示為「建立失敗」,則回應會包含failureReason索引鍵,說明工作失敗的原因。

注意

匯入需要一些時間。您必須等到狀態顯示為 ACTIVE 後,才能使用資料集訓練模型。

請求語法

{ "datasetArn": "string", "dataSource": { "dataLocation": "string" }, "importMode": "string", "jobName": "string", "publishAttributionMetricsToS3": boolean, "roleArn": "string", "tags": [ { "tagKey": "string", "tagValue": "string" } ] }

請求參數

請求接受採用 JSON 格式的下列資料。

datasetArn

接收匯入資料之資料集的 ARN。

類型:字串

長度限制:長度上限為 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

必要:是

dataSource

此為 Amazon S3 儲存貯體,其中包含要匯入的訓練資料。

類型:DataSource 物件

必要:是

importMode

指定如何將新記錄新增至現有資料集。預設匯入模式為FULL。如果您之前尚未將大量記錄匯入資料集,則只能指定FULL

  • FULL定覆寫資料集中所有現有的大量資料。不會取代您個別匯入的資料。

  • 指定INCREMENTAL將新記錄附加到資料集中的現有資料。Amazon Personalize 化將任何記錄替換為新的 ID 相同的 ID。

類型:字串

有效值:FULL | INCREMENTAL

必要:否

jobName

資料集匯入工作的名稱。

類型:字串

長度限制:長度下限為 1。長度上限為 63。

模式:^[a-zA-Z0-9][a-zA-Z0-9\-_]*

必要:是

publishAttributionMetricsToS3

如果您建立了指標歸因,請指定是否將此匯入任務的指標發佈到 Amazon S3

類型:布林值

必要:否

roleArn

此為 IAM 角色的 ARN,該角色具有從 Amazon S3 資料來源讀取資料的許可。

類型:字串

長度限制:長度上限為 256。

模式:arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

必要:是

tags

要套用至資料集匯入工作的標籤清單。

類型:Tag 物件陣列

陣列成員:項目數下限為 0。項目數上限為 200。

必要:否

回應語法

{ "datasetImportJobArn": "string" }

回應元素

如果動作成功,則服務傳回 HTTP 200 回應。

服務會傳回下列 JSON 格式的資料。

datasetImportJobArn

資料集匯入任務的 ARN。

類型:字串

長度限制:長度上限為 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

錯誤

InvalidInputException

提供欄位或參數的有效值。

HTTP 狀態碼:400

LimitExceededException

已超過每秒要求數目的限制。

HTTP 狀態碼:400

ResourceAlreadyExistsException

指定的資源已存在。

HTTP 狀態碼:400

ResourceInUseException

指定的資源正在使用中。

HTTP 狀態碼:400

ResourceNotFoundException

找不到指定的資源。

HTTP 狀態碼:400

TooManyTagsException

您已超過可套用至此資源的標籤數目上限。

HTTP 狀態碼:400

另請參閱

如需在其中一個特定語言 AWS SDK 中使用此 API 的詳細資訊,請參閱下列內容: