翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データセットとスキーマの作成
ステップ 1: データセットグループを作成する を完了したら、データセットを作成する準備が整います。レコードを一括インポートする場合は、「データ形式のガイドライン」を確認し、Amazon S3 バケットへのアップロードを完了してください。
データセットは、データ用の Amazon Personalize のコンテナです。データセットを作成するときは、データセットのスキーマも作成します。スキーマは、Amazon Personalize にデータの構造を知らせ、Amazon Personalize がデータを解析できるようにします。
データセットは、Amazon Personalize コンソール、AWS Command Line Interface (AWS CLI)、または AWS SDK を使用して作成します。さまざまなタイプのデータセット、およびデータセットとスキーマの要件については、「データセットとスキーマ」を参照してください。
データセットとスキーマの作成 (コンソール)
これがデータセットグループの最初のデータセットである場合、最初のデータセットタイプは Interactions データセットになります。コンソールで Interactions データセットを作成するには、データセット名を指定してから、Avro 形式
Amazon Personalize のデータセットとスキーマの要件については、「データセットとスキーマ」を参照してください。
注記
ステップ 1: データセットグループを作成する を完了したばかりで、既にユーザーとアイテムのインタラクションのページが表示されている場合は、この手順のステップ 4 にスキップしてください。
データセットとスキーマを作成するには
-
https://console.aws.amazon.com/personalize/home
で Amazon Personalize コンソールを開き、アカウントにサインインします。 -
[Dataset groups] (データセットグループ) のページで、ステップ 1: データセットグループを作成する で作成したデータセットグループを選択します。これにより、データセットグループの [Dashboard] (ダッシュボード) が表示されます。
-
[Upload datasets] (データセットをアップロード) のセクションで、インポートするデータセットのタイプ (Amazon Personalize データセットには、Interactions、Users、または Items が含まれます) について、[Import] (インポート) を選択します。[Configure < dataset type >] (< データセットタイプ > を設定) のページが表示されます。
-
[Dataset details] (データセットの詳細) の [Dataset name] (データセット名) で、データセットの名前を指定します。
-
[Schema details] (スキーマの詳細) の [Schema selection] (スキーマを選択) で、既存のスキーマを選択するか、[Create new schema] (新しいスキーマを作成) を選択します。
-
新しいスキーマを作成する場合は、[Schema definition] (スキーマの定義) で、データに一致するスキーマ JSON を貼り付けます。データセットとスキーマ の例をガイドとして使用してください。スキーマを作成した後は、スキーマに変更を加えることはできなくなります。
-
[New schema name (新しいスキーマ名)] で、新しいスキーマの名前を指定します。
-
[タグ] には、オプションで任意のタグを追加します。Amazon Personalize リソースへのタグ付けの詳細については、「Amazon Personalize リソースへのタグ付け」を参照してください。
-
[Next] (次へ) を選択し、一括データの準備とインポート の指示に従ってデータをインポートします。
データセットとスキーマの作成 (AWS CLI)
AWS CLI を使用してデータセットとスキーマを作成するには、最初に Avro 形式
スキーマとデータセットを作成するには
-
Avro 形式のスキーマファイルを作成し、JSON ファイルとして保存します。このファイルは、作成している Interactions などのデータセットのタイプに基づいている必要があります。
スキーマはデータの列と一致する必要があり、スキーマ
name
は Amazon Personalize によって認識される 3 種類のデータセットのいずれかと一致する必要があります。最小限の Interactions データセットスキーマの例を次に示します。その他の例については、「データセットとスキーマ」を参照してください。{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
-
次のコマンドを実行して Amazon Personalize でスキーマを作成します。スキーマを作成した後は、スキーマに変更を加えることはできなくなります。
schemaName
をスキーマの名前に、file://SchemaName.json
を前のステップで作成した JSON ファイルの場所に、それぞれ置き換えます。次の例は、現在のフォルダに属するファイルを示しています。 API の詳細については、「CreateSchema」を参照してください。aws personalize create-schema \ --name
SchemaName
\ --schemafile://SchemaName.json
次の例に示すように、スキーマの Amazon リソースネーム (ARN) が表示されます。
{ "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
-
次のコマンドを実行して空のデータセットを作成します。データセットグループの作成 (AWS CLI) のデータセットグループの Amazon リソースネーム (ARN) と前の手順のスキーマ ARN を指定します。
dataset-type
は、前のステップのスキーマname
と一致する必要があります。 API の詳細については、「CreateDataset」を参照してください。aws personalize create-dataset \ --name
Dataset Name
\ --dataset-group-arnDataset Group ARN
\ --dataset-typeDataset Type
\ --schema-arnSchema Arn
次の例に示すように、データセット ARN が表示されます。
{ "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
-
後で使用するためにデータセット ARN を記録します。データセットを作成したら、トレーニングデータをインポートする準備が整います。一括データの準備とインポート を参照してください。
データセットとスキーマの作成 (AWS SDK)
AWS SDK を使用してデータセットとスキーマを作成するには、最初に Avro 形式
スキーマとデータセットを作成するには
-
Avro 形式のスキーマファイルを作成し、JSON ファイルとして作業ディレクトリに保存します。
スキーマはデータの列と一致する必要があり、スキーマ
name
は Amazon Personalize によって認識される 3 種類のデータセットのいずれかと一致する必要があります。最小限の Interactions データセットスキーマの例を次に示します。その他の例については、「データセットとスキーマ」を参照してください。{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
-
CreateSchema API 操作を使用してスキーマを作成します。次のコードは、スキーマの作成方法を示しています。スキーマの名前とスキーマ JSON ファイルのファイルパスを指定します。
Amazon Personalize は、新しいスキーマの ARN を返します。次のステップで必要になるため、これを記録します。
-
CreateDataset 操作を使用してデータセットを作成します。次のコードは、データセットを作成する方法を示しています。データセットグループの ARN (Interactions、Users、または Items) を指定し、データセットタイプ (Interactions、Users、または Items) を指定してください。データセットのタイプ別の詳細については、「データセットとスキーマ」を参照してください。
データセットを作成したら、トレーニングデータをインポートする準備が整います。「一括データの準備とインポート」を参照してください。