Amazon Personalize
開発者ガイド

開始方法

この入門ガイドでは、600 人のユーザーによる 9700 本の映画の 100,000 数の映画評価で構成される履歴データに基づいて、ユーザーに映画推薦を返すキャンペーンを作成する方法を説明します。

このガイドを簡素化するために:

  • ユーザーが映画を見たという事実に基づいており、映画の評価内容は問いません。これにより、トレーニングデータを簡単に作成することができます。

  • イベントレコードのライブユーザーのインタラクションイベントは記録されません。ユーザーイベントをキャプチャする方法については、「イベントの記録」を参照してください。

開始するには、トレーニングデータをダウンロードして準備します。次に、お客様に代わって Amazon Personalize がデータにアクセスすることを許可する AWS Identity and Access Management (IAM) ロールを作成します。トレーニングデータとロールを作成すると、「開始方法 (コンソール)」または「開始方法 (AWS CLI)」に進むことができます。

入門ガイドの演習を完了したら、作成したリソースを削除できます。詳細については、「リソースのクリーンアップ」を参照してください。

前提条件

以下のステップは、入門ガイド演習の前提条件です。

  • AWS にサインアップする に指定されているように、AWS アカウントおよび AWS Identity and Access Management ユーザーを作成します。

  • 使用している IAM ユーザーに 必要なアクセス許可 があることを確認します。

  • IAM ロールの作成 で指定されているように、AWS Identity and Access Management (IAM) サービスロールを作成します。このロールの ARN は、映画のトレーニングデータをアップロードするときに使用します。

  • トレーニングデータを準備し、このデータを Amazon S3 バケットにアップロードします。「トレーニングデータを作成する」の手順に従ってください。この Amazon S3 バケットの名前は、映画のトレーニングデータをアップロードするときに使用します。

トレーニングデータを作成する

トレーニングデータを作成するには、映画のレーティングデータをダウンロードして変更し、Amazon Simple Storage Service (Amazon S3) バケットに保存します。次に、このバケットから読み取るためのアクセス許可を Amazon Personalize に付与します。

  1. 映画のレーティング zip ファイル (ml-latest-small.zip) を MovieLens ([recommended for education and development] の下) からダウンロードします。ファイルを解凍します。ユーザーインタラクションデータは、ratings.csv というファイル内にあります。

  2. ratings.csv ファイルを開きます。

    1. [評価] 列を削除します。

    2. ヘッダー行を以下のように置き換えます。

      USER_ID,ITEM_ID,TIMESTAMP

      Amazon Personalize でデータを認識するには、これらのヘッダーを正確に表示する必要があります。

    ratings.csv ファイルを保存します。

  3. ratings.csv を Amazon S3 バケットにアップロードします。詳細については、Amazon Simple Storage Service コンソールユーザーガイド の「ドラッグアンドドロップを使用したファイルとフォルダのアップロード」を参照してください。

  4. バケット内のデータを読み取るためのアクセス許可を Amazon Personalize に付与します。詳細については、「Amazon S3 バケットへのアップロード」を参照してください。

リソースのクリーンアップ

不要な料金が発生しないようにするには、使用開始実習の終了後に作成したリソースを削除します。リソースを削除するには、SDK の Amazon Personalize コンソールまたは Delete API、または AWS Command Line Interface (AWS CLI) を使用します。たとえば、DeleteCampaign API を使用してキャンペーンを削除します。

ステータスが CREATE PENDING または IN PROGRESS のリソースを削除することはできません。リソースのステータスは ACTIVE または CREATE FAILED である必要があります。ステータスは Describe API を使用して​確認します (DescribeCampaign など)。

次の表に示すように、一部のリソースは他のものよりも前に削除する必要があります。このプロセスには時間がかかる場合があります。

アップロードしたトレーニングデータ (ratings.csv) を削除するには、「S3 バケットからオブジェクトを削除する方法」を参照してください。

削除するリソース 最初にこちらを削除します コメント
Campaign
DatasetImportJob 削除できません。
EventTracker イベントトラッカーに関連付けられたイベントインタラクションデータセットは削除されず、引き続きソリューションバージョンによって使用されます。
Dataset

関連付け済み DatasetImportJob は、CREATE PENDING または IN PROGRESS のステータスを持つことはできません。

関連付け済み SolutionVersion は、CREATE PENDING または IN PROGRESS のステータスを持つことはできません。

DatasetSchema スキーマを参照するすべてのデータセット。
Solution ソリューションバージョンに基づくすべてのキャンペーン。 関連付け済み SolutionVersion は、CREATE PENDING または IN PROGRESS のステータスを持つことはできません。
SolutionVersion 関連付けられた Solution が削除されたときに削除されます。
DatasetGroup

すべての関連付けられたイベントトラッカー。

すべての関連付けられたソリューション。

データセットグループのすべてのデータセット。