Items データセットスキーマの要件 (カスタム) - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Items データセットスキーマの要件 (カスタム)

製品データセットには、カタログ内のアイテムに関するメタデータが保存されます。これには、各アイテムについての料金、ジャンル、利用可否などの情報が含まれる場合があります。Amazon Personalize がインポートできるデータの種類については、「製品データセット」を参照してください。

各アイテム用に入力するデータは、Items データセットのスキーマと一致している必要があります。少なくとも、各アイテムについてアイテム ID を指定する必要があります (最大長 256 文字)。スキーマによっては、アイテムメタデータに空/null 値を含めることができます。スキーマには少なくとも 1 つのメタデータフィールドが必要ですが、null タイプを追加すると、アイテムのこの値は null になる可能性があります。ユースケースとデータに応じて、さらにフィールドを追加することができます。フィールドが必須または予約済みとして記載されておらず、データ型が スキーマのデータ型 に記載されている限り、フィールド名とデータ型は自由に設定できます。

カテゴリデータを使用するには、タイプ string のフィールドを追加し、スキーマでフィールドのカテゴリ属性を true に設定します。その後、カテゴリデータをバルク CSV ファイルと個別アイテムインポートに含めます。カテゴリ値には、最大 1,000 文字を使用できます。1,000 文字を超えるカテゴリ値を持つアイテムがある場合、データセットのインポートジョブは失敗します。

複数のカテゴリを持つアイテムについては、バーティカルバー「|」を使用して各値を区切ります。例えば、GENRES フィールドについて、アイテムのデータは Action|Crime|Biopic である場合があります。複数のレベルのカテゴリデータがあり、一部のアイテムで階層内の各レベルに複数のカテゴリがあるアイテムがある場合は、各レベルにフィールドを追加し、フィールド名の後にレベルインジケータ GENRE_L2、GENRE_L2、GENRE_L2、GENRE_L3 を追加します。これにより、アイテムが複数のマルチレベルカテゴリに属している場合でも、サブカテゴリに基づいてレコメンデーションをフィルタリングできます (フィルタの作成と使用については、「レコメンデーションとユーザーセグメントのフィルタリング」を参照してください)。例えば、動画にはカテゴリレベルごとに次のデータが含まれている場合があります。

  • GENRES: アクション|アドベンチャー

  • GENRE_L2: 犯罪|西部劇

  • GENRE_L3: バイオピック

この例では、動画はアクション > 犯罪 > バイオピックの階層、およびアドベンチャー > ウエスタン > バイオピックの階層です。L3 まで使用することをお勧めしますが、必要に応じてもっと多くのレベルを使用できます。

モデルトレーニング中に、Amazon Personalize は最大 750,000 アイテムを考慮します。750,000 を超えるアイテムをインポートする場合、Amazon Personalize は、新しいアイテム (インタラクションなしで最近追加したアイテム) と最近のインタラクションデータを含む既存のアイテムを含めることに重点を置いて、トレーニングに含めるアイテムを決定します。

Items データセットの最小要件と最大データ制限の詳細については、「Service Quotas」を参照してください。

Items データセットのスキーマの例 (カスタム)

次の例は、アイテムスキーマを構築する方法を示します。ITEM_ID フィールドは必須です。GENRE フィールドはカテゴリメタデータであり、DESCRIPTION フィールドはテキストメタデータです。少なくとも 1 つのメタデータフィールドが必要です。最大 100 個のメタデータフィールドを追加できます。CREATION_TIMESTAMP フィールドは予約済みのキーワードです。スキーマ要件については、「カスタムデータセットとスキーマの要件」を参照してください。

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }, ], "version": "1.0" }

このスキーマでは、CSV ファイルの履歴データの最初の数行は次のようになる場合があります。

ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...