Amazon Personalize
開発者ガイド

入力データのフォーマット

データを Amazon Personalize 内にインポートするために使用するファイルは、使用しているスキーマに対応している必要があります。

Amazon Personalize は、CSV 形式のファイルからデータをインポートします。CSV ファイルでは、各値をカンマで区切ります。Amazon Personalize では、CSV ファイルの 1 行目に列ヘッダーを含める必要があります。CSV ファイルの列ヘッダーは、データセットで使用されているスキーマに対応している必要があります。ヘッダーを二重引用符 (") で囲むことはできません。

たとえば、次の CSV データサンプルは、データセットとスキーマ で以前に作成した Interactions スキーマに対応します。このデータは、映画のチケットを販売するウェブサイトの過去のユーザーアクティビティを表します。このデータを使用して、他のユーザーのアクティビティに基づき映画のレコメンデーションをユーザーに提供するモデルをトレーニングできます。

USER_ID,ITEM_ID,EVENT_TYPE,EVENT_VALUE,TIMESTAMP 196,242,click,15,881250949 186,302,click,13,891717742 22,377,click,10,878887116 244,51,click,20,880606923 166,346,click,10,886397596 298,474,click,40,884182806 115,265,click,20,881171488 253,465,click,50,891628467 305,451,click,30,886324817

関連する Interactions スキーマを以下に繰り返します。

{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "EVENT_TYPE", "type": "string" }, { "name": "EVENT_VALUE", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }

Amazon Personalize は、USER_ID、ITEM_ID、および TIMESTAMP の各フィールドを必要とします。USER_ID は、アプリケーションのユーザーの識別子です。ITEM_ID は、映画の識別子です。EVENT_TYPE および EVENT_VALUE は、ユーザーアクティビティの識別子です。サンプルデータで、click は映画の購入イベントを表し、15 は映画の購入料金を表しています。TIMESTAMP は、映画の購入が発生した Unix 時間を表します。

カテゴリ別データ

カテゴリ別文字列データを使用する場合に 1 つの項目に複数のカテゴリを含めるには、縦棒文字「|」を使用して値を区切ります。たとえば、前のセクションの項目スキーマを 2 つのカテゴリを使用して一致させるには、データ行は次のようになります。

ITEM_ID,GENRE item_123,horror|comedy

フォーマットしたデータは、Amazon S3 バケットにアップロードした上で、Amazon Personalize 内にインポートします。詳細については、「Amazon S3 バケットへのアップロード」を参照してください。

このページの内容: