トレーニングに使用するアイテムインタラクションデータの選択 - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

トレーニングに使用するアイテムインタラクションデータの選択

重要

デフォルトでは、すべての新しいソリューションで自動トレーニングが使用されます。自動トレーニングでは、ソリューションがアクティブになっている間、トレーニングコストが発生します。不要なコストを避けるために、完了したらソリューションを更新して自動トレーニングをオフにできます。トレーニングコストの詳細については、「Amazon Personalize の料金」を参照してください。

Amazon Personalize がソリューションバージョンの作成 (モデルのトレーニング) 時に使用するアイテムインタラクションデータセットのイベントを選択できます。トレーニングの前にアイテムインタラクションデータを選択すると、データの関連するサブセットのみをトレーニングに使用したり、ノイズを除去して、より最適化されたモデルをトレーニングしたりできます。アイテムインタラクションデータセットの詳細については、「」を参照してくださいアイテムインタラクションデータ

注記

User-Personalization-v2 または Personalized-Ranking-v2 を使用する場合、トレーニングコストは、イベントタイプまたは値でフィルタリングする前にアイテムインタラクションデータに基づきます。料金の詳細については、「Amazon Personalize の料金」を参照してください。

アイテムインタラクションデータは次のように選択できます。

  • タイプに基づいてレコードを選択する – ソリューションを設定するときに、アイテムインタラクションデータセットに EVENT_TYPE 列にイベントタイプが含まれている場合は、オプションでトレーニングで使用するイベントタイプを指定できます。例えば、アイテムインタラクションデータセットに [購入]、[クリック]、および [視聴] イベントタイプが含まれており、Amazon Personalize で [視聴] イベントのみを使用してモデルをトレーニングする場合、ソリューションを設定するときに、Amazon Personalize がトレーニングで使用する event type として [視聴] を指定します。

    アイテムインタラクションデータセットの EVENT_TYPE 列に複数のイベントタイプがあり、ソリューションを設定するときにイベントタイプを指定しない場合、Amazon Personalize は、タイプに関係なく、同じ重みでトレーニングするためにすべてのアイテムインタラクションデータを使用します。

  • タイプと値に基づいてレコードを選択する – ソリューションを設定するときに、アイテムインタラクションデータセットに EVENT_TYPE フィールドと EVENT_VALUE フィールドが含まれている場合、特定の値をしきい値として設定して、トレーニングからレコードを除外できます。例えば、Watch の EVENT_VALUE を持つイベントの EVENT_TYPE データが、ユーザーが視聴した動画の割合である場合、イベント値のしきい値を 0.5 に設定し、 を視聴するイベントタイプを設定すると、Amazon Personalize は EVENT_VALUE が 0.5 以上のWatch インタラクションイベントのみを使用してモデルをトレーニングします。

次のコードは、 SDK for Python (Boto3) を使用して、 がビデオの半分以上を視聴したwatchイベントのみを使用するソリューションを作成する方法を示しています。

import boto3 personalize = boto3.client('personalize') create_solution_response = personalize.create_solution( name = 'solution name', datasetGroupArn = 'arn:aws:personalize:region:accountId:dataset-group/datasetGroupName', recipeArn = 'arn:aws:personalize:::recipe/aws-user-personalization-v2', eventType = 'watch', solutionConfig = { "eventValueThreshold": "0.5" } ) # Store the solution ARN solution_arn = create_solution_response['solutionArn'] # Use the solution ARN to get the solution status solution_description = personalize.describe_solution(solutionArn = solution_arn)['solution'] print('Solution status: ' + solution_description['status'])