CreateDataset - Amazon Forecast

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

CreateDataset

建立 Amazon Forecast 資料集。您提供的資料集相關資訊有助於 Forecast 了解如何使用資料進行模型訓練。這包含下列項目:

  • DataFrequency – 收集歷史時間序列資料的頻率。

  • Domain DatasetType – 每個資料集都有網域內相關聯的資料集網域和類型。Amazon Forecast 提供每個網域內預先定義的網域和類型的清單。針對網域內每個唯一的資料集網域和類型,Amazon Forecast 要求資料包含最基本的一組預先定義欄位。

  • Schema – 結構描述指定資料集中的欄位,包括欄位名稱和資料類型。

建立資料集之後,您將訓練資料匯入至其中並將資料集新增至資料集群組。您可以使用資料集群組來建立預測器。如需詳細資訊,請參閱匯入資料集

若要取得所有資料集的清單,請使用此ListDatasets作業。

例如 Forecast 資料集,請參閱 Amazon Forecast 範例 GitHub儲存庫

注意

資料集 Status 的必須是 ACTIVE,然後您才能匯入訓練資料。使用DescribeDataset操作來獲取狀態。

請求語法

{ "DataFrequency": "string", "DatasetName": "string", "DatasetType": "string", "Domain": "string", "EncryptionConfig": { "KMSKeyArn": "string", "RoleArn": "string" }, "Schema": { "Attributes": [ { "AttributeName": "string", "AttributeType": "string" } ] }, "Tags": [ { "Key": "string", "Value": "string" } ] }

請求參數

請求接受採用 JSON 格式的下列資料。

DataFrequency

資料收集的頻率。RELATED_TIME_SERIES 資料集需要此參數。

有效間隔為整數,後跟 Y (年)、M (月)、W (週)、D (天)、H (小時) 和 min (分鐘)。例如,"1D" 表示每隔一天,"15min" 表示每隔 15 分鐘。您無法指定會與下一個較大頻率重疊的值。例如,這意味著您不能指定頻率為 60 分鐘,因為這相當於 1 小時。每個頻率的有效值如下:

  • 分鐘–1-59

  • 小時–1-23

  • 天–1-6

  • 週–1-4

  • 月–1-11

  • 年 – 1

因此,如果您希望每兩週預測一次,請指定 "2W"。或者,如果您希望每季度預測一次,請指定 "3M"。

類型:字串

長度限制:長度下限為 1。最大長度為 5。

模式:^Y|M|W|D|H|30min|15min|10min|5min|1min$

必要:否

DatasetName

資料集的名稱。

類型:字串

長度限制:長度下限為 1。長度上限為 63。

模式:^[a-zA-Z][a-zA-Z0-9_]*

必要:是

DatasetType

資料集類型。有效值取決於選擇的Domain

類型:字串

有效值:TARGET_TIME_SERIES | RELATED_TIME_SERIES | ITEM_METADATA

必要:是

Domain

與資料集相關聯的網域。當您將資料集新增至資料集群組時,此值和為CreateDatasetGroup作業Domain參數指定的值必須相符。

您選擇DatasetTypeDomain和會決定您匯入至資料集之訓練資料中必須存在的欄位。例如,如果您選擇RETAIL網域 TARGET_TIME_SERIESDatasetType,並且 Amazon Forecast 要求item_idtimestamp、和demand欄位出現在您的資料中。如需詳細資訊,請參閱匯入資料集

類型:字串

有效值:RETAIL | CUSTOM | INVENTORY_PLANNING | EC2_CAPACITY | WORK_FORCE | WEB_TRAFFIC | METRICS

必要:是

EncryptionConfig

Amazon Forecast 可以承擔存取金鑰的 AWS Key Management Service AWS Identity and Access Management (KMS) 金鑰和 (IAM) 角色。

類型:EncryptionConfig 物件

必要:否

Schema

資料集的結構描述。結構描述屬性及其順序必須與資料中的欄位相符。您所選的資料集 DomainDatasetType 決定了訓練資料中最基本的必要欄位。如需有關特定資料集網域和類型的必要欄位的資訊,請參閱資料集網域和資料集類型

類型:Schema 物件

必要:是

Tags

您套用至資料集的選擇性中繼資料,以協助您分類和組織這些中繼資料。每個標籤皆包含由您定義的一個金鑰與一個選用值。

以下基本限制適用於標籤:

  • 每個資源的最大標籤數量-50。

  • 對於每一個資源,每個標籤金鑰必須是唯一的,且每個標籤金鑰只能有一個值。

  • 金鑰長度上限-UTF-8 中 128 個萬國碼字元。

  • 最大值長度-UTF-8 中 256 個萬國碼字元。

  • 如果您的標記結構描述是跨多項服務和資源使用,請記得其他服務可能會有字元使用限制。通常允許的字元包括:可用 UTF-8 表示的英文字母、數字和空格,還有以下字元:+ - = . _ : / @。

  • 標籤鍵與值皆區分大小寫。

  • 請勿使用aws:AWS:、或任何大寫或小寫的組合,例如索引鍵的前置字元,因為它會保留供 AWS 使用。您無法使用此字首編輯或刪除標籤關鍵字。值可以有這個前綴。如果標籤值aws作為其前綴,但鍵沒有,則 Process Forecast 將其視為使用者標記,並會計入 50 個標籤的限制。只有 key prefix 的標籤aws不會計入每個資源限制的標籤。

類型:Tag 物件陣列

陣列成員:項目數下限為 0。項目數上限為 200。

必要:否

回應語法

{ "DatasetArn": "string" }

回應元素

如果動作成功,則服務傳回 HTTP 200 回應。

服務會傳回下列 JSON 格式的資料。

DatasetArn

資料集的 Amazon Resource Name (ARN)。

類型:字串

長度限制:長度上限為 256。

模式:arn:([a-z\d-]+):forecast:.*:.*:.+

錯誤

InvalidInputException

我們無法處理要求,因為它包含無效值或超出有效範圍的值。

HTTP 狀態碼:400

LimitExceededException

已超過每個帳號的資源數量限制。

HTTP 狀態碼:400

ResourceAlreadyExistsException

已有此名稱的資源。請使用不同的名稱再試一次。

HTTP 狀態碼:400

另請參閱

如需在其中一個特定語言 AWS SDK 中使用此 API 的詳細資訊,請參閱下列內容: