CreateDatasetImportJob - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CreateDatasetImportJob

データソース (Amazon S3 バケット) から Amazon Personalize データセットにトレーニングデータをインポートするジョブを作成します。Amazon Personalize がトレーニングデータをインポートできるようにするには、Amazon Personalize がデータのコピーを作成して内部で処理するため、データソースからの読み取り許可を持つ IAM サービスロールを指定する必要があります。Amazon S3 バケットへのアクセスを許可する方法については、「Amazon Personalize に Amazon S3 リソースへのアクセスを許可する」を参照してください。

レコメンダーをすでに作成しているか、キャンペーンでカスタムソリューションバージョンをデプロイしている場合、新しいバルクレコードがレコメンデーションにどのように影響するかは、使用するドメインのユースケースまたはレシピによって異なります。詳細については、「新しいデータがリアルタイムのレコメンデーションに与える影響」を参照してください。

重要

デフォルトでは、データセットのインポートジョブは、一括でインポートしたデータセット内の既存のデータを置き換えます。既存のデータを置き換えずに新しいレコードを追加するには、 CreateDatasetImportJob 操作のインポートモードに INCREMENTAL を指定します。

[ステータス]

データセットのインポートジョブは、次のいずれかの状態になります。

  • CREATE PENDING > CREATE IN_PROGRESS > ACTIVE -または- CREATE FAILED

インポートジョブのステータスを取得するには、データセットインポートジョブの Amazon リソースネーム (ARN) を指定してを呼び出しますDescribeDatasetImportJob。ステータスが ACTIVE と表示されると、データセットのインポートが完了します。ステータスが CREATE FAILED と表示されている場合、レスポンスには、ジョブが失敗した理由を記述する failureReason キーが含まれています。

注記

インポートには時間がかかります。ステータスが ACTIVE になるまで待ってから、データセットを使用してモデルをトレーニングしてください。

リクエストの構文

{ "datasetArn": "string", "dataSource": { "dataLocation": "string" }, "importMode": "string", "jobName": "string", "publishAttributionMetricsToS3": boolean, "roleArn": "string", "tags": [ { "tagKey": "string", "tagValue": "string" } ] }

リクエストパラメータ

リクエストは以下の JSON 形式のデータを受け入れます。

datasetArn

インポートされたデータを受け取るデータセットの ARN。

型: 文字列

長さの制限:最大長は 256 です。

パターン:arn:([a-z\d-]+):personalize:.*:.*:.+

必須:はい

dataSource

インポートするトレーニングデータを含む Amazon S3 バケット。

型: DataSource オブジェクト

必須: はい

importMode

新しいレコードを既存のデータセットに追加する方法を指定します。デフォルトのインポートモードは FULL です。以前にデータセットに一括レコードをインポートしたことがない場合は、FULL を指定することしかできません。

  • データセット内の既存のバルクデータをすべて上書きするように FULL を指定します。個別にインポートしたデータは置き換えられません。

  • データセット内の既存のデータに新しいレコードを追加するように INCREMENTAL を指定します。Amazon Personalize は、同じ ID のレコードをすべて新しいレコードに置き換えます。

型: 文字列

有効な値:FULL | INCREMENTAL

必須:いいえ

jobName

データセットのインポートジョブの名前。

型: 文字列

長さの制限:最小長は 1 です。最大長は 63 です。

Pattern: ^[a-zA-Z0-9][a-zA-Z0-9\-_]*

必須:はい

publishAttributionMetricsToS3

メトリクス属性を作成した場合は、このインポートジョブのメトリクスを Amazon S3 に発行するかどうかを指定します。

型: ブール値

必須: いいえ

roleArn

Amazon S3 データソースから読み取るための許可を持つ IAM ロールの ARN。

型: 文字列

長さの制限:最大長は 256 です。

パターン:arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

必須:はい

tags

データセットのインポートジョブに適用するタグのリスト。

タイプ:Tag オブジェクトの配列

配列メンバー: 最小数は 0 項目です。最大数は 200 項目です。

必須: いいえ

レスポンスの構文

{ "datasetImportJobArn": "string" }

レスポンス要素

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

サービスから以下のデータが JSON 形式で返されます。

datasetImportJobArn

データセットのインポートジョブの ARN。

型: 文字列

長さの制限:最大長は 256 です。

パターン:arn:([a-z\d-]+):personalize:.*:.*:.+

エラー

InvalidInputException

フィールドまたはパラメータに有効な値を指定します。

HTTP ステータスコード:400

LimitExceededException

1 秒あたりのリクエスト数の上限を超えています。

HTTP ステータスコード:400

ResourceAlreadyExistsException

指定したリソースはすでに存在しています。

HTTP ステータスコード:400

ResourceInUseException

指定されたリソースは使用中です。

HTTP ステータスコード:400

ResourceNotFoundException

指定されたリソースが見つかりませんでした。

HTTP ステータスコード:400

TooManyTagsException

このリソースに適用できるタグの最大数を超過しています。

HTTP ステータスコード:400

その他の参照資料

この API を言語固有の AWS SDK で使用する方法の詳細については、以下を参照してください。