カスタムデータセットとスキーマ - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタムデータセットとスキーマ

カスタムデータセットグループを作成する場合、独自のスキーマを最初から作成します。カスタムデータセットグループのデータセットとスキーマでは、必須フィールドは少ないですが、高い柔軟性があります。以下のトピックでは、カスタムデータセットグループのデータセットのスキーマとデータ要件について説明します。各データセットのセクションでは、データセットタイプに必要なデータが一覧表示され、スキーマの JSON の例が提供されます。

Amazon Personalize が使用できるデータの種類については、「データセット」を参照してください。フォーマット要件や使用可能なフィールドデータ型など、Amazon Personalize スキーマの一般的な要件については、「 スキーマ」を参照してください。これらの要件はすべての Amazon Personalize スキーマに適用されます。

カスタムデータセットとスキーマの要件

カスタムデータセットグループのデータセットを作成する場合、各データセットタイプには、次の必須フィールドと、必須データタイプの予約済みキーワードがあります。

データセットタイプ 必須フィールド 予約済みキーワード
アイテムインタラクション (スキーマの例)

USER_ID (string)

ITEM_ID (string)

TIMESTAMP (long)

EVENT_TYPE (string)

EVENT_VALUE (floatnull)

IMPRESSION (stringnull)

RECOMMENDATION_ID (stringnull)

EVENT_ATTRIBUTION_SOURCE (stringnull)

ユーザー (スキーマの例)

USER_ID (string)

1 つのメタデータフィールド (カテゴリ別 string または数値)

アイテム (スキーマの例)

ITEM_ID (string)

1 つのメタデータフィールド (カテゴリまたはテキスト string フィールドまたは数値フィールド)

CREATION_TIMESTAMP (long)

Actions (スキーマの例)

ACTION_ID (string)

1 つのメタデータフィールド (カテゴリ別 string または数値)

CREATION_TIMESTAMP (long)

VALUE (longnull)

TYPE (stringnull)

EXPIRATION_TIMESTAMP (longnull)

REPEAT_FREQUENCY (longnull)

Action interactions (スキーマの例)

USER_ID (string)

ACTION_ID (string)

EVENT_TYPE (string)

TIMESTAMP (long)

IMPRESSION (stringnull)

RECOMMENDATION_ID (stringnull)

メタデータフィールド

メタデータには、必須ではない、または予約済みのキーワードを使用しない文字列または非文字列のフィールドが含まれます。メタデータスキーマには、次の制限があります。

  • ユーザー、アイテム、アクションのスキーマには、少なくとも 1 つのメタデータフィールドが必要です。

  • Users スキーマには最大 25 のメタデータフィールドを追加でき、Items スキーマには最大 100 のメタデータフィールドを追加でき、Actions スキーマには最大 10 のメタデータフィールドを追加できます。

  • タイプ string の独自のメタデータフィールドを追加する場合は、categorical 属性または textual 属性を含める必要があります (アイテムスキーマのみがテキスト属性のフィールドをサポートします)。それ以外の場合、Amazon Personalize は、モデルのトレーニング時にフィールドを使用しません。

予約済みキーワード

予約済みのキーワードはオプションの非メタデータフィールドです。これらのフィールドは、使用時に必須のデータ型としてフィールドを定義する必要があり、キーワードをデータに含める値として使用することができないため、予約済みとみなされます。予約済みカテゴリ文字列フィールドは categoricaltrue に設定されている必要がありますが、予約済み文字列フィールドはカテゴリに設定できません。予約済みキーワードは次のとおりです。

  • EVENT_TYPE: クリックダウンロードの両方など、1 つ以上のイベントタイプを持つアイテムインタラクションデータセットについては、EVENT_TYPE フィールドを使用します。EVENT_TYPE フィールドを string として定義する必要があり、カテゴリとして設定することはできません。

  • EVENT_VALUE: ユーザーが視聴した動画の割合など、イベントの値データを含むアイテムインタラクションデータセットについては、タイプ float とオプションで null を持つ EVENT_VALUE フィールドを使用します。

  • CREATION_TIMESTAMP: 各アイテムの作成日のタイムスタンプを持つ Items または Actions データセットについては、タイプ longCREATION_TIMESTAMP フィールドを使用します。Amazon Personalize は、CREATION_TIMESTAMP データを使用してアイテムが存在するようになってからの期間を計算し、それに応じてレコメンデーションを調整します。作成のタイムスタンプデータ を参照してください。

  • IMPRESSION: 明示的なインプレッションデータを持つアイテムインタラクションデータセットについては、タイプ String およびオプションでタイプ nullIMPRESSION フィールドを使用します。インプレッションは、ユーザーが特定のアイテムを操作した (例えば、クリックや視聴した) ときに表示されたアイテムのリストです。詳細については、「インプレッションデータ」を参照してください。

  • RECOMMENDATION_ID: 以前のレコメンデーションを暗黙的なインプレッションデータとして使用するアイテムインタラクションデータセットについては、タイプ String およびオプションでタイプ nullRECOMMENDATION_ID フィールドを使用します。

    レコメンデーションを生成するときに暗黙的なインプレッションを使用するために、Amazon Personalize の RECOMMENDATION_ID フィールドを追加する必要はありません。それなしで PutEvents 操作で recommendationId を渡すことができます。詳細については、「インプレッションデータ」を参照してください。

  • VALUE: Actions データセットで、アクションの一部または全部に値がある場合には、スキーマに VALUE フィールドを追加します。そのタイプについては、long とオプションでタイプ null を使用します。アクションとそれらの値の詳細については、「[Value data] (値のデータ)」を参照してください。

  • ACTION_EXPIRATION_TIMESTAMP: Actions データセットで、アクションの一部または全部に有効期限のタイムスタンプがある場合は、スキーマに ACTION_EXPIRATION_TIMESTAMP フィールドを追加します。そのタイプについては、long とオプションでタイプ null を使用します。有効期限タイムスタンプの詳細については、「アクション有効期限のタイムスタンプデータ」を参照してください。

  • REPEAT_FREQUENCY: Actions データセットで、アクションの一部または全部に頻度データがある場合には、スキーマに REPEAT_FREQUENCY フィールドを追加します。そのタイプについては、long とオプションでタイプ null を使用します。繰り返し頻度データの詳細については、「繰り返し頻度データ」を参照してください。