開始方法の前提条件 - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

開始方法の前提条件

以下のステップは、入門ガイド演習の前提条件です。

  1. AWS にサインアップする に指定されているように、AWS アカウントおよび AWS Identity and Access Management ユーザーを作成します。

  2. ユーザーと Amazon Personalize に Amazon Personalize のリソースへのフルアクセスを提供する IAM ポリシーを作成します。その後、Amazon Personalize ユーザーまたはグループにポリシーをアタッチします。「新しい IAM ポリシーの作成」を参照してください。

  3. Amazon Personalize の IAM ロールの作成 で指定されているように、AWS Identity and Access Management (IAM) サービスロールを作成します。このロールの ARN は、映画のトレーニングデータをアップロードするときに使用します。

  4. トレーニングデータを準備し、このデータを Amazon S3 バケットにアップロードします。

  5. Amazon Personalize に対する、Amazon S3 リソースへのアクセスの付与 で指定されているように、Amazon S3 リソースにアクセスするための許可を Amazon Personalize のサービスロールに付与します。

トレーニングデータの作成 (ドメインデータセットグループ)

トレーニングデータを作成するには、映画のレーティングデータをダウンロードして変更し、Amazon Simple Storage Service (Amazon S3) バケットに保存します。その後、バケットから読み取るための許可を Amazon Personalize に付与します。

トレーニングデータを作成するには

  1. 映画の評価内容は問わない zip ファイルをダウンロードして解凍します。ml-latest-small.zipからMovieLens教育と開発に推奨(F. マクスウェル・ハーパーとジョセフ・A・コンスタン. 2015. - MovieLens データセット:歴史とコンテキスト。 対話型インテリジェントシステム (TII) の ACM トランザクション 5, 4:19:1 — 19:19. https://doi.org/10.1145/2827872)。

  2. ratings.csv ファイルを開きます。このファイルには、このチュートリアルのインタラクションデータが含まれています。

    1. [評価] 列を削除します。

    2. userIdmovieId の列の名前をそれぞれ USER_IDITEM_ID に変更します。

    3. EVENT_TYPE 列を追加して、すべてのレコードの値を watch に設定します。Microsoft Excel を使用している場合は、列の最初のセルに watch を入力し、セルの右下をダブルクリックすることで、すべてのレコードに EVENT_TYPE を設定できます。ヘッダーは次のようになります。

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE

      Amazon Personalize でデータを認識するには、これらの列を正確に表示する必要があります。データの最初の数行は次のようになります。

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE 1,1,964982703,watch 1,3,964981247,watch 1,6,964982224,watch 1,47,964983815,watch 1,50,964982931,watch .... ....

    ratings.csv ファイルを保存します。

  3. Amazon S3 バケットに ratings.csv をアップロードします。詳細については、Amazon Simple Storage Service ユーザーガイドの「ドラッグアンドドロップを使用したファイルとフォルダのアップロード」を参照してください。

  4. バケット内のデータを読み取るための許可を Amazon Personalize に付与します。詳細については、「Amazon Personalize に対する、Amazon S3 リソースへのアクセスの付与」を参照してください。

トレーニングデータの作成 (カスタムデータセットグループ)

トレーニングデータを作成するには、映画のレーティングデータをダウンロードして変更し、Amazon Simple Storage Service (Amazon S3) バケットに保存します。その後、バケットから読み取るための許可を Amazon Personalize に付与します。

  1. 映画の評価内容は問わない zip ファイルをダウンロードして解凍します。ml-latest-small.zipからMovieLens教育と開発に推奨(F. マクスウェル・ハーパーとジョセフ・A・コンスタン. 2015. - MovieLens データセット:歴史とコンテキスト。 対話型インテリジェントシステム (TII) の ACM トランザクション 5, 4:19:1 — 19:19. https://doi.org/10.1145/2827872)。

  2. ratings.csv ファイルを開きます。このファイルには、このチュートリアルのインタラクションデータが含まれています。

    1. [評価] 列を削除します。

    2. ヘッダー行を以下のように置き換えます。

      USER_ID,ITEM_ID,TIMESTAMP

      Amazon Personalize でデータを認識するには、これらのヘッダーを正確に表示する必要があります。

    ratings.csv ファイルを保存します。

  3. Amazon S3 バケットに ratings.csv をアップロードします。詳細については、Amazon Simple Storage Service ユーザーガイドの「ドラッグアンドドロップを使用したファイルとフォルダのアップロード」を参照してください。

  4. バケット内のデータを読み取るための許可を Amazon Personalize に付与します。詳細については、「Amazon Personalize に対する、Amazon S3 リソースへのアクセスの付与」を参照してください。