ユーザーパーソナライズのレシピ - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ユーザーパーソナライズのレシピ

ユーザーパーソナライゼーション (aws-user-personalization) レシピは、すべてのパーソナライズされたレコメンデーションシナリオに最適化されています。これは、やり取り、製品、ユーザーのデータセットに基づいて、ユーザーが操作するアイテムを予測します。アイテムをレコメンディングするときは、自動アイテム探索を使用します。

自動探索により、Amazon Personalize は、さまざまな商品のレコメンデーションを自動的にテストし、ユーザーがこれらの推奨商品とどのようにやり取りするかを学習し、エンゲージメントとコンバージョンを促進する商品のレコメンデーションを強化します。これにより、急速に変化するカタログがある場合、またはニュース記事やプロモーションなどの新しいアイテムが新しいときにユーザーに関連性が高まる場合に、アイテムの発見とエンゲージメントが向上します。

探索する量(インタラクションデータや関連性の低いアイテムがより頻繁に推奨される場所)と、悪用する量(レコメンデーションがわかっているものや関連性に基づく場所)のバランスを取ることができます。Amazon Personalize は、暗黙的なユーザーフィードバックに基づいて、今後のおすすめを自動的に調整します。

自動更新

ユーザーパーソナライゼーションでは、Amazon Personalize は 2 時間ごとに最新のモデル(ソリューションバージョン)を自動的に更新し、新しいソリューションバージョンを作成せずに新しいデータを含めます。Amazon Personalize は更新するたびに、ソリューションバージョンを最新のアイテム情報で更新し、ユーザーからの暗黙的なフィードバックに従って探索を調整します。これにより、Amazon Personalize は、既に探索されている商品の新しいインタラクションに基づいて商品の品質を測定し、商品調査を継続的に更新することができます。これは完全な再トレーニングではありません。新しいソリューションバージョンを毎週トレーニングする必要がありますtrainingModeをに設定FULLしたがって、モデルはユーザーの行動から学習できます。

2 時間ごとに十分な頻度でなければ、を使用してソリューションバージョンを手動で作成できます。trainingModeをに設定UPDATEこれらの新しいアイテムをレコメンデーションに含めます。Amazon Personalize では、完全にトレーニングされた最新のソリューションバージョンのみが自動的に更新されるため、手動で更新されたソリューションバージョンは今後自動的に更新されることはありません。

注記

自動更新には費用がかかりません。

更新要件

Amazon Personalize は、トレーニングを受けた最新のソリューションバージョンのみを自動的に更新しますtrainingModeをに設定FULLまた、前回の自動更新以降に新しいアイテムまたはインタラクションデータを提供した場合に限ります。新しいソリューションバージョンをトレーニングした場合、Amazon Personalize はキャンペーンにデプロイした古いソリューションバージョンを自動的に更新しません。データセットを削除した場合も、更新は行われません。

注記

Amazon Personalize は 2020 年 11 月 17 日以降に作成したソリューションバージョンのみ自動的に更新されます。

インプレッションデータの使用

ポジティブなインタラクション(クリック、ウォッチング、または購入)のみを使用する他のレシピとは異なり、ユーザーパーソナライゼーションレシピではインプレッションデータも使用できます。インプレッションは、ユーザーが特定のアイテムとインタラクション(クリック、ウォッチ、購入など)したときに表示されていたアイテムのリストです。

この情報を使用して、User-Personalization レシピで作成されたソリューションでは、アイテムが無視された頻度に基づいて新しいアイテムの適合性を計算し、それに応じてレコメンデーションを変更できます。詳細については、「」を参照してください。インプレッションデータ

プロパティおよびハイパーパラメータ

[User-Personalization] レシピには以下のプロパティがあります。

  • 名前aws-user-personalization

  • レシピ Amazon リソースネーム (ARN)arn:aws:personalize:::recipe/aws-user-personalization

  • アルゴリズム ARNarn:aws:personalize:::algorithm/aws-user-personalization

詳細については、「ステップ 1: レシピの選択」を参照してください。

次の表では、User-Personalization レシピのハイパーパラメータについて説明します。ハイパーパラメータは、モデルパフォーマンスを向上させるために調整できるアルゴリズムパラメータです。アルゴリズムのハイパーパラメータは、モデルの実行方法を制御します。特徴化のハイパーパラメータは、トレーニングで使用するデータのフィルタリング方法を制御します。ハイパーパラメータに最適な値を選択するプロセスは、ハイパーパラメータの最適化 (HPO) と呼ばれます。詳細については、「ハイパーパラメータおよび HPO」を参照してください。

このテーブルには、各ハイパーパラメータに関する以下の情報も含まれています。

  • 範囲: [下限、上限]

  • 値の型: 整数、連続 (浮動小数点)、カテゴリ別 (ブール値、リスト、文字列)

  • 調整可能な HPO: パラメータが HPO に参加できますか?

[Name] (名前) 説明
アルゴリズムのハイパーパラメータ
hidden_dimension

モデルで使用される非表示変数の数。非表示の変数は、ユーザーの購入履歴と商品統計を再作成して、ランキングスコアを生成します。インタラクションデータセットにより複雑なパターンが含まれている場合は、より多くの非表示ディメンションを指定します。使用する非表示のディメンションが多くなると、データセットが大きくなり、処理時間が長くなります。最適な値を決定するには、HPO を使用します。HPO を使用するには、CreateSolution オペレーション CreateSolutionVersion とオペレーションを呼び出すときに performHPOtrue に設定します。

デフォルト値: 149

範囲: [32、256]

値の型: 整数

HPO 調整可能: はい

bptt

通し時間のバックプロパゲーションの手法を使用するかどうかを決定します。通し時間のバックプロパゲーションは、再帰的なニューラルネットワークベースのアルゴリズムの重みを更新する手法です。遅延報酬を早期イベントに接続するには、長期クレジットに bptt を使用します。たとえば、遅延報酬には、数回のクリック後に行われる購入を指定できます。早期イベントは、最初のクリックにすることができます。クリックなどの同じイベントタイプ内であっても、長期的な効果を考慮し、合計報酬を最大化することをお勧めします。長期的な効果を考慮するには、より大きい bptt 値を使用します。大きな bptt 値を使用するには、より大きいデータセットと長い処理時間が必要です。

デフォルト値: 32

範囲: [2、32]

値の型: 整数

HPO 調整可能: はい

recency_mask

モデルがインタラクションデータセットの最新の人気傾向を考慮する必要があるかどうかを決定します。最新の人気トレンドには、インタラクションイベントの基盤となるパターンの突然の変化が含まれる可能性があります。最近のイベントにより多くの重みを置くモデルをトレーニングするには、recency_masktrue に設定します。過去のすべてのインタラクションを均等に重み付けするモデルをトレーニングするには、recency_maskfalse に設定します。同じ重みを使用して適切なレコメンデーションを取得するには、より大きなトレーニングデータセットが必要になる場合があります。

デフォルト値: True

範囲: True または False

値の型: [Boolean] (ブール値)

HPO 調整可能: はい

特徴化のハイパーパラメータ
min_user_history_length_percentile

モデルのトレーニングに含めるユーザー履歴の長さの最小パーセンタイル。履歴の長さ は、ユーザーに関するデータの合計量です。履歴の長さが短いある割合のユーザーを除外するには、min_user_history_length_percentile を使用します。履歴が短いユーザーは、多くの場合、ユーザーの個人的なニーズや希望ではなく、アイテムの人気に基づくパターンを表示します。それらを削除すると、データの基盤となるパターンに重点を置いてモデルをトレーニングできます。ヒストグラムまたは同様のツールを使用して、ユーザー履歴の長さを確認した後で適切な値を選択します。大部分のユーザーを保持し、エッジケースを削除する値を設定することをお勧めします。

たとえば、min_user_history_length_percentile to 0.05max_user_history_length_percentile to 0.95 を設定すると、履歴の長さが下位または上位 5% であるユーザーを除くすべてのユーザーが含まれます。

デフォルト値: 0.0

範囲: [0.0, 1.0]

値の型: 浮動小数点

HPO 調整可能: いいえ

max_user_history_length_percentile

モデルのトレーニングに含めるユーザー履歴の長さの最大パーセンタイル。履歴の長さ は、ユーザーに関するデータの合計量です。max_user_history_length_percentile を使用して、ある割合の履歴の長さが長いユーザーを除外します。これらのユーザーのデータにはノイズが含まれる傾向があるためです。たとえば、ロボットに自動化されたインタラクションの長いリストがあるとします。これらのユーザーを削除することで、トレーニングのノイズが制限されます。ヒストグラムまたは同様のツールを使用して、ユーザー履歴の長さを確認した後で適切な値を選択します。大部分のユーザーを保持し、エッジケースを削除する値を設定することをお勧めします。

たとえば、min_user_history_length_percentile to 0.05max_user_history_length_percentile to 0.95 を設定すると、履歴の長さが下位または上位 5% であるユーザーを除くすべてのユーザーが含まれます。

デフォルト値: 0.99

範囲: [0.0, 1.0]

値の型: 浮動小数点

HPO 調整可能: いいえ

アイテム探索キャンペーン設定のハイパーパラメーター
exploration_weight

インタラクションデータまたは関連性の低いアイテムがレコメンデーションに含まれる頻度を決定します。値が 1.0 に近ければ近いほど、探索も多くなります。ゼロの場合、探索は発生せず、推奨事項は現在のデータ(関連性)に基づきます。詳細については、「」を参照してください。CampaignConfig

デフォルト値: 0.3

範囲: [0.0, 1.0]

値の型: 浮動小数点

HPO 調整可能: いいえ

exploration_item_age_cut_off

最新のインタラクションからの時間枠に基づいて、探索するアイテムを決定します。アイテム探索の範囲を定義するために、最新のインタラクションからの最大アイテム経過日数を指定します。値が大きいほど、探索中に考慮されるアイテムが多くなります。詳細については、「」を参照してください。CampaignConfig

デフォルト値: 30.0

範囲: 正の浮動小数点

値の型: 浮動小数点

HPO 調整可能: いいえ

ユーザーパーソナライゼーションレシピを使用したトレーニング (コンソール)

User-Personalization レシピを使用してコンソールでレコメンデーションを生成するには、まずレシピを使用して新しいソリューションバージョンをトレーニングします。そして、ソリューションバージョンを使用してキャンペーンを展開し、そのキャンペーンを使用してレコメンデーションを取得します。

ユーザーパーソナライゼーションレシピを使用した新しいソリューションバージョンのトレーニング (コンソール)

  1. で Amazon Personalize コンソールを開きます。https://console.aws.amazon.com/personalize/homeそして、アカウントにサインインします。

  2. 新しいスキーマを使用してカスタムデータセットグループを作成し、インプレッションデータを含むデータセットをアップロードします。オプションで「」TIMESTAMPそして非構造化テキストメタデータ商品データセット内のデータ。Amazon Personalize が商品の年齢をより正確に計算し、冷たい商品を特定できるようにします。

    データのインポートの詳細については、「」を参照してください。データの準備とインポート

  3. リポジトリの []データセットグループページで、インプレッションデータを含むデータセットを含む新しいデータセットグループを選択します。

  4. ナビゲーションペインで、[] を選択します。ソリューションとレシピを選択しソリューションを作成します。

  5. リポジトリの []ソリューションを作成します。の「」ページソリューション名に、新しいソリューションの名前を入力します。

  6. を使用する場合ソリューション型で、商品の推奨をクリックして、ユーザー向けのアイテムレコメンデーションを取得します。

  7. を使用する場合レシピで、aws-user-personalization。-ソリューション構成セクションが表示され、いくつかの設定オプションが表示されます。

  8. Eclipseソリューション構成インタラクションデータセットに EVENT_TYPE 列または EVENT_TYPE 列と EVENT_VALUE 列の両方がある場合、オプションでイベントタイプそしてイベント値のしきい値フィールドを使用して、Amazon Personalize がモデルをトレーニングするときに使用するインタラクションデータを選択します。

    詳細については、「」を参照してください。トレーニングに使用するインタラクションデータの選択

  9. オプションで、ソリューションのハイパーパラメーターを構成します。ユーザーパーソナライゼーションレシピのプロパティとハイパーパラメータのリストについては、を参照してください。プロパティおよびハイパーパラメータ

  10. 選択ソリューションの作成とトレーニングをにトレーニングを開始します。-ダッシュボード[] ページが表示されます。

    ソリューションの詳細ページに移動して、トレーニングの進捗状況をソリューションバージョンセクションに追加します。トレーニングが完了すると、ステータスが [] に変わります。アクティブ

キャンペーンの作成とレコメンデーションの取得 (コンソール)

ソリューションのバージョンのステータスが次の場合アクティブキャンペーンを作成し、以下の推奨事項を取得する準備が整いました。

  1. ソリューションの詳細ページまたはキャンペーン[] ページで []新しいキャンペーンの作成

  2. リポジトリの []新しいキャンペーンの作成ページ、キャンペーンの詳細で、次の情報を入力します。

    • キャンペーンの名前: キャンペーンの名前を入力します。ここで入力したテキストは、キャンペーンダッシュボードと詳細ページに表示されます。

    • 解決策: 先ほど作成したソリューションを選択します。

    • ソリューションバージョン ID: 先ほど作成したソリューションバージョンの ID を選択します。

    • 1 秒あたりの最小プロビジョンドトランザクション: Amazon Personalize がサポートしている 1 秒あたりの最小プロビジョニングされたトランザクションを設定します。詳細については、CreateCampaign オペレーションを参照してください。

  3. を使用する場合キャンペーンの設定で、次の情報を入力します。

    • 探査重量: 探索する量を構成します。レコメンデーションでは、より頻繁にインタラクションデータまたは関連性の低いアイテムが含まれる場合、より詳細な探索を指定します。値が 1 に近ければ近いほど、探索が増えます。ゼロの場合、探索は発生せず、推奨事項は現在のデータ(関連性)に基づきます。

    • 探検アイテム年齢が切り取られた: アイテム調査の範囲を定義するために、最新のインタラクションからの最大品目経過日数を入力します。Amazon Personalize が調査中に考慮する商品の数を増やすには、より大きな値を入力します。

      たとえば、10 と入力すると、データセット内の最新のインタラクションから 10 日間のインタラクションデータを含むアイテムのみが探索時に考慮されます。

      注記

      レコメンデーションには、この時間枠外からのインタラクションデータがないアイテムが含まれる場合があります。これは、これらのアイテムがユーザーの興味に関連しており、それらを特定するために調査が必要ではないためです。

  4. [Create campaign (キャンペーンの作成)] を選択します。

  5. キャンペーンの詳細ページで、キャンペーンのステータスがの場合アクティブでは、キャンペーンを使用してレコメンデーションを取得し、インプレッションを記録できます。詳細については、「」を参照してください。ステップ 5: 推奨事項の取得の「開始方法」を参照してください。

    Amazon Personalize は 2 時間ごとに最新のソリューションバージョンを自動的に更新し、新しいデータを含めます。キャンペーンでは、更新されたソリューションバージョンが自動的に使用されます。詳細については、「」を参照してください。自動更新

    キャンペーンを手動で更新するには、まず、コンソールまたはCreateSolutionVersionオペレーション、trainingModeをに設定update。次に、でキャンペーンを手動で更新します。キャンペーンコンソールのページ、または [] を使用してUpdateCampaignオペレーション.

    注記

    Amazon Personalize は 2020 年 11 月 17 日より前に作成したソリューションのバージョンを自動的に更新しません。

ユーザーパーソナライゼーションレシピを使用したトレーニング (Python SDK)

データセットグループを作成し、インプレッションデータを含むデータセットをアップロードしたら、User-Personalization レシピを使用してソリューションをトレーニングできます。オプションで「」TIMESTAMPそして非構造化テキストメタデータ商品データセット内のデータ。Amazon Personalize が商品の年齢をより正確に計算し、冷たい商品を特定できるようにします。データセットグループの作成およびトレーニングデータのアップロードの詳細については、「」を参照してください。データセットとスキーマ

を使用してユーザーパーソナライゼーションレシピを使用してソリューションをトレーニングするにはAWSSDK

  1. を使用して、新しいソリューションを作成します。create_solutionメソッド。

    置換solution nameソリューション名とdataset group arnデータセットグループの Amazon リソースネーム (ARN) を使用します。

    import boto3 personalize = boto3.client('personalize') print('Creating solution') create_solution_response = personalize.create_solution(name = 'solution name', recipeArn = 'arn:aws:personalize:::recipe/aws-user-personalization', datasetGroupArn = 'dataset group arn', ) solution_arn = create_solution_response['solutionArn'] print('solution_arn: ', solution_arn)

    のリストについてはaws-user-personalizationレシピのプロパティとハイパーパラメータについては、を参照してください。プロパティおよびハイパーパラメータ

  2. 新しい を作成するソリューションバージョン更新されたトレーニングデータとセットtrainingModeFULL次のコードスニペットを使用します。を交換してください。solution arnソリューションの ARN を使用します。

    import boto3 personalize = boto3.client('personalize') create_solution_version_response = personalize.create_solution_version(solutionArn = 'solution arn', trainingMode='FULL') new_solution_version_arn = create_solution_version_response['solutionVersionArn'] print('solution_version_arn:', new_solution_version_arn)
  3. Amazon Personalize でソリューションバージョンの作成が完了したら、次のパラメータを使用してキャンペーンを作成します。

    • 新しいものを提供するcampaign namesolution version arnステップ 2 で生成されます。

    • の変更explorationWeightアイテム探索構成ハイパーパラメーターを使用して、探索する量を構成します。インタラクションデータまたは関連性の低いアイテムは、値が 1.0 に近いほど頻繁に推奨されます。デフォルト値は 0.3 です。

    • の変更explorationItemAgeCutOffアイテム探索構成ハイパーパラメータパラメーター。アイテムを探索する最新のインタラクションに対する最大期間 (日数) を指定します。値が大きいほど、探索中に考慮されるアイテムが多くなります。

    次の Python スニペットを使用して、30 日の探索カットオフを使用した探索に重点を置いた新しいキャンペーンを作成します。キャンペーンの作成には通常数分かかりますが、1 時間以上かかる場合があります。

    import boto3 personalize = boto3.client('personalize') create_campaign_response = personalize.create_campaign( name = 'campaign name', solutionVersionArn = 'solution version arn', minProvisionedTPS = 1, campaignConfig = {"itemExplorationConfig": {"explorationWeight": "0.3", "explorationItemAgeCutOff": "30"}} ) campaign_arn = create_campaign_response['campaignArn'] print('campaign_arn:', campaign_arn)

    ユーザーパーソナライゼーションでは、Amazon Personalize は 2 時間ごとにソリューションバージョンを自動的に更新し、新しいデータを含めます。キャンペーンでは、更新されたソリューションバージョンが自動的に使用されます。詳細については、「」を参照してください。自動更新

    キャンペーンを手動で更新するには、まず、コンソールまたはCreateSolutionVersionオペレーション、trainingModeをに設定update。次に、でキャンペーンを手動で更新します。キャンペーンコンソールのページ、または [] を使用してUpdateCampaignオペレーション.

    注記

    Amazon Personalize は 2020 年 11 月 17 日より前に作成したソリューションのバージョンを自動的に更新しません。

レコメンデーションを取得してインプレッションを記録する (SDK for Python (Boto3)))

キャンペーンが作成されたら、そのキャンペーンを使用してユーザーのレコメンデーションを取得し、インプレッションを記録できます。を使用してバッチレコメンデーションを取得する方法については、AWSSDKを参照バッチ推論ジョブの作成 (AWS SDK)

レコメンデーションを取得し、インプレッションを記録するには

  1. get_recommendations メソッドを呼び出します。を変更campaign arn新しいキャンペーンのARNに、user idをuserId に追加します。

    import boto3 rec_response = personalize_runtime.get_recommendations(campaignArn = 'campaign arn', userId = 'user id') print(rec_response['recommendationId'])
  2. 送信用の新しいイベントトラッカーを作成します。PutEventsリクエスト. 置換event tracker nameイベントトラッカーの名前とdataset group arnデータセットグループの ARN を使用します。

    import boto3 personalize = boto3.client('personalize') event_tracker_response = personalize.create_event_tracker( name = 'event tracker name', datasetGroupArn = 'dataset group arn' ) event_tracker_arn = event_tracker_response['eventTrackerArn'] event_tracking_id = event_tracker_response['trackingId'] print('eventTrackerArn:{},\n eventTrackingId:{}'.format(event_tracker_arn, event_tracking_id))
  3. を使用するrecommendationIdステップ 1 からevent tracking idステップ 2 から、新しいものを作成するPutEventsリクエスト. このリクエストは、ユーザーのセッションからの新しいインプレッションデータを記録します。を変更user idをユーザーの ID に設定します。

    import boto3 personalize_events.put_events( trackingId = 'event tracking id', userId= 'user id', sessionId = '1', eventList = [{ 'sentAt': datetime.now().timestamp(), 'eventType' : 'click', 'itemId' : rec_response['itemList'][0]['itemId'], 'recommendationId': rec_response['recommendationId'], 'impression': [item['itemId'] for item in rec_response['itemList']], }] )

サンプルJupyter ノートブック

ユーザーパーソナライゼーションレシピの使用方法を示す Jupyter ノートブックのサンプルについては、「」を参照してください。探索によるユーザーパーソナライズ