翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データセットとスキーマの作成
ステップ 1: データセットグループを作成する を完了したら、データセットを作成する準備が整います。データセットは、データ用の Amazon Personalize のコンテナです。データセットを作成するときは、データセットのスキーマも作成します。スキーマは、Amazon Personalize にデータの構造を知らせ、Amazon Personalize がデータを解析できるようにします。
データセットは、Amazon Personalize コンソール、AWS Command Line Interface (AWS CLI)、または AWS SDK を使用して作成します。さまざまなタイプのデータセット、およびデータセットとスキーマの要件については、「データセットとスキーマ」を参照してください。
データセットとスキーマの作成 (コンソール)
これがデータセットグループの最初のデータセットである場合、最初のデータセットタイプはアイテムインタラクションデータセットになります。コンソールでアイテムインタラクションデータセットを作成するには、データセット名を指定してから、Avro 形式
Amazon Personalize のデータセットとスキーマの要件については、「データセットとスキーマ」を参照してください。
注記
「ステップ 1: データセットグループを作成する」を完了したばかりで、既にデータセットを作成している場合は、この手順のステップ 4 にスキップしてください。
データセットとスキーマを作成するには
-
https://console.aws.amazon.com/personalize/home
で Amazon Personalize コンソールを開き、アカウントにサインインします。 -
[Dataset groups] (データセットグループ) のページで、ステップ 1: データセットグループを作成する で作成したデータセットグループを選択します。
-
[データセットの設定] で [データセットの作成] を選択し、作成するデータセットのタイプを選択します。
-
[Amazon Personalize データセットにデータを直接インポートする] を選択し、[次へ] を選択します。
-
[Dataset details] (データセットの詳細) の [Dataset name] (データセット名) で、データセットの名前を指定します。
-
[Schema details] (スキーマの詳細) の [Schema selection] (スキーマを選択) で、既存のスキーマを選択するか、[Create new schema] (新しいスキーマを作成) を選択します。
-
新しいスキーマを作成する場合は、[Schema definition] (スキーマの定義) で、データに一致するスキーマ JSON を貼り付けます。 スキーマ の例をガイドとして使用してください。スキーマを作成した後は、スキーマに変更を加えることはできなくなります。
-
[New schema name (新しいスキーマ名)] で、新しいスキーマの名前を指定します。
-
[タグ] には、オプションで任意のタグを追加します。Amazon Personalize リソースのタグ付けの詳細については、「Amazon Personalize リソースのタグ付け」を参照してください。
-
[Next] (次へ) を選択し、バルクデータの準備とインポート の指示に従ってデータをインポートします。
データセットとスキーマの作成 (AWS CLI)
AWS CLI を使用してデータセットとスキーマを作成するには、最初に Avro 形式
スキーマとデータセットを作成するには
-
Avro 形式のスキーマファイルを作成し、JSON ファイルとして保存します。このファイルは、作成している Interactions などのデータセットのタイプに基づいている必要があります。
スキーマはデータの列と一致する必要があり、スキーマ
name
は Amazon Personalize で認識されるデータセットのタイプのいずれかと一致する必要があります。最小限のアイテムインタラクションデータセットスキーマの例を次に示します。その他の例については、「 スキーマ」を参照してください。{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
-
次のコマンドを実行して Amazon Personalize でスキーマを作成します。スキーマを作成した後は、スキーマに変更を加えることはできなくなります。
schemaName
をスキーマの名前に、file://SchemaName.json
を前のステップで作成した JSON ファイルの場所に、それぞれ置き換えます。次の例は、現在のフォルダに属するファイルを示しています。ドメインデータセットグループ内のデータセットのスキーマを作成する場合は、
domain
パラメータを追加してECOMMERCE
またはVIDEO_ON_DEMAND
に設定します。API の詳細については、「CreateSchema」を参照してください。aws personalize create-schema \ --name
SchemaName
\ --schemafile://SchemaName.json
次の例に示すように、スキーマの Amazon リソースネーム (ARN) が表示されます。
{ "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
-
次のコマンドを実行して空のデータセットを作成します。データセットグループの作成 (AWS CLI) のデータセットグループの Amazon リソースネーム (ARN) と前の手順のスキーマ ARN を指定します。データセットタイプの値は、
Interactions
、Users
、Items
、Actions
、またはAction_Interactions
です。API の詳細については、「CreateDataset」を参照してください。aws personalize create-dataset \ --name
Dataset Name
\ --dataset-group-arnDataset Group ARN
\ --dataset-typeDataset Type
\ --schema-arnSchema Arn
次の例に示すように、データセット ARN が表示されます。
{ "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
-
後で使用するためにデータセット ARN を記録します。データセットを作成したら、トレーニングデータをインポートする準備が整います。「バルクデータの準備とインポート」を参照してください。
データセットとスキーマの作成 (AWS SDK)
AWS SDK を使用してデータセットとスキーマを作成するには、最初に Avro 形式
スキーマとデータセットを作成するには
-
Avro 形式のスキーマファイルを作成し、JSON ファイルとして作業ディレクトリに保存します。
スキーマはデータの列と一致する必要があり、スキーマ
name
は Amazon Personalize で認識されるデータセットの種類と一致する必要があります。最小限のアイテムインタラクションデータセットスキーマの例を次に示します。その他の例については、「 スキーマ」を参照してください。{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
-
次のコードを使用してスキーマを作成します。スキーマの名前とスキーマ JSON ファイルのファイルパスを指定します。
ドメインデータセットグループ内のデータセットのスキーマを作成する場合は、
domain
パラメータを追加してECOMMERCE
またはVIDEO_ON_DEMAND
に設定します。API の詳細については、「CreateSchema」を参照してください。Amazon Personalize は、新しいスキーマの ARN を返します。次のステップで必要になるため、これを記録します。
-
CreateDataset 操作を使用してデータセットを作成します。以下のコードは、データセットを作成する方法を示しています。データセットグループの Amazon リソースネーム (ARN)、前のステップのスキーマ ARN を指定し、データセットタイプを指定します。データセットタイプの値は、
Interactions
、Users
、Items
、Actions
、またはAction_Interactions
です。データセットのタイプ別の詳細については、「データセットとスキーマ」を参照してください。データセットを作成したら、トレーニングデータをインポートする準備が整います。「バルクデータの準備とインポート」を参照してください。