製品データセット - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

製品データセット

Amazon Personalize にインポートできるアイテムデータには、作成タイムスタンプ、料金、ジャンル、説明、利用可否などの数値およびカテゴリのメタデータが含まれます。アイテムに関するメタデータを Amazon Personalize の Items データセットにインポートします。

Amazon Personalize は、トレーニング時にアイテムのタイトルや作成者データなど、カテゴリ以外の文字列アイテムデータを使用しません。ただし、Amazon Personalize の一部の機能では、このデータを使用してレコメンデーションを強化しています。詳細については、「非カテゴリ別文字列データ」を参照してください。

メタデータ列の最大数は 100 です。トレーニング時にモデルで検討されるアイテムの最大数は 750,000 です。Amazon Personalize は、レコメンデーションを生成する際にこれらのアイテムのみを考慮します。一部のドメインとレシピには、Items データセットが必要です。レシピ要件の詳細については、レシピの選択 を参照してください。

このトピックでは、次のタイプのアイテムデータに関する情報を提供します。

作成のタイムスタンプデータ

Amazon Personalize は、作成タイムスタンプデータ (Unix エポック時間形式 (秒)) を使用してアイテムが存在するようになってからの期間を計算し、それに応じてレコメンデーションを調整します。

1 つ以上のアイテムについて作成タイムスタンプのデータが欠落している場合、Amazon Personalize は、インタラクションデータがある場合はこの情報からこの情報を推測し、アイテムの最も古いインタラクションデータのタイムスタンプをアイテムの作成タイムスタンプとして使用します。アイテムにインタラクションデータがない場合、その作成タイムスタンプはトレーニングセット内の最新のインタラクションのタイムスタンプとして設定され、Amazon Personalize はそれを新しいアイテムとみなします。

カテゴリ別メタデータ

特定のレシピとドメインでは、Amazon Personalize は、ユーザーにとって最も関連性の高いアイテムを明らかにする基本的なパターンを識別する際に、アイテムのジャンルや色などのカテゴリメタデータを使用します。ユースケースに基づいて独自の値の範囲を定義します。カテゴリメタデータはどの言語でもかまいません。

すべてのレシピとドメインで、カテゴリデータをインポートし、それを使用してアイテムの属性に基づいてレコメンデーションをフィルタリングできます。フィルタリングのレコメンデーションについては、「レコメンデーションとユーザーセグメントのフィルタリング」を参照してください。

カテゴリ値には、最大 1,000 文字まで入力できます。1,000 文字を超えるカテゴリ値を持つアイテムがある場合、データセットのインポートジョブは失敗します。

ドメインデータセットグループについては、VIDEO_ON_DEMAND ドメインと ECOMMERCE ドメインの両方がカテゴリメタデータを使用します。カスタムデータセットグループおよびカスタムソリューションについては、カテゴリメタデータを使用するレシピには次のものが含まれます。

非構造化テキストメタデータ

特定のレシピとドメインを使用すると、Amazon Personalize は、製品の説明、製品のレビュー、映画のあらすじなど、非構造化テキストメタデータから有意義な情報を抽出できます。Amazon Personalize は、非構造化テキストを使用して、特にアイテムが新しい場合やインタラクションデータが少ない場合に、ユーザーに関連するアイテムを識別します。Items データセットに非構造化テキストデータを含めて、カタログ内の新しいアイテムのクリック率とコンバージョン率を高めます。

非構造化データを使用するには、タイプ string のフィールドをアイテムスキーマに追加し、フィールドの textual 属性を true に設定します。その後、テキストデータをバルク CSV ファイルと増分アイテムインポートに含めます。バルク CSV ファイルについては、テキストを二重引用符で囲みます。\ 文字を使用して、データ内の二重引用符または \ 文字をエスケープします。最大 1 つのテキストフィールドしか追加できません。非構造化テキストデータのフィールドを持つ Items スキーマの例については、「Items データセットのスキーマの例 (カスタム)」を参照してください。Amazon Personalize では、テキストフィールドは文字数制限で切り捨てられます。テキスト内の最も関連性の高い情報がフィールドの先頭にあることを確認してください。Amazon Personalize へのデータのインポートについては、「ステップ 2: データの準備とインポート」を参照してください。

非構造化テキスト値を使用する前に、Amazon Personalize はテキストから以下を削除します。

  • HTML と XML のタグとエンティティ

  • 改行、タブ、および余分なスペース文字

非構造化テキストの値は、中国語と日本語を除くすべての言語で最大 20,000 文字を使用できます。中国語と日本語については、最大 7,000 文字を使用できます。Amazon Personalize は、文字数制限を超える値を上限値になるように切り捨てます。

テキストは次の言語で入力できます。

  • 簡体字中国語

  • 繁体字中国語

  • 英語

  • フランス語

  • ドイツ語

  • 日本語

  • ポルトガル語

  • スペイン語

非構造化テキストアイテムは複数の言語で送信できますが、各アイテムのテキストは 1 言語のみである必要があります。

ドメインデータセットグループについては、VIDEO_ON_DEMAND ドメインと ECOMMERCE ドメインの両方がテキストメタデータを使用します。カスタムデータセットグループおよびカスタムソリューションについては、テキストメタデータを使用するレシピには次のものが含まれます。

非カテゴリ別文字列データ

アイテム ID 以外、Amazon Personalize は、トレーニング時にアイテムのタイトルや作成者データなど、カテゴリ別以外の文字列アイテムデータを使用しません。ただし、Amazon Personalize の以下の機能では使用することがあります。

  • Amazon Personalize では、カテゴリ別以外の文字列値を含むアイテムメタデータをレコメンデーションに含めることができます。メタデータを使用して、映画のレコメンデーションカルーセルに監督の名前を追加するなど、ユーザーインターフェイスのレコメンデーションを充実させることができます。詳細については、「レコメンデーションのメタデータを有効にする」を参照してください。

  • Similar-Items を使用すると、テーマ付きのレコメンデーションを一括生成できます。テーマを使用してレコメンデーションを一括生成する場合、一括推論ジョブでアイテム名列を指定する必要があります。詳細については、「Content Generator のテーマ付きバッチレコメンデーション」を参照してください。

  • カテゴリ別以外の文字列データに基づいて、レコメンデーションにアイテムを含めたり、レコメンデーションからアイテムを削除したりするフィルターを作成できます。フィルターの詳細については、「レコメンデーションとユーザーセグメントのフィルタリング」を参照してください。