アイテムデータ - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

アイテムデータ

Amazon Personalize にインポートできるアイテムデータには、作成タイムスタンプ、料金、ジャンル、説明、利用可否などの数値およびカテゴリのメタデータが含まれます。アイテムに関するメタデータを Amazon Personalize の Items データセットにインポートします。一部のドメインとレシピには、Items データセットが必要です。レシピ要件の詳細については、ステップ 1: レシピの選択 を参照してください。

このトピックでは、次のタイプのアイテムデータに関する情報を提供します。

作成のタイムスタンプデータ

Amazon Personalize は、作成タイムスタンプデータ (Unix エポック時間形式 (秒)) を使用してアイテムが存在するようになってからの期間を計算し、それに応じてレコメンデーションを調整します。

1 つ以上のアイテムについて作成タイムスタンプのデータが欠落している場合、Amazon Personalize は、インタラクションデータがある場合はこの情報からこの情報を推測し、アイテムの最も古いインタラクションデータのタイムスタンプをアイテムの作成タイムスタンプとして使用します。アイテムにインタラクションデータがない場合、その作成タイムスタンプはトレーニングセット内の最新のインタラクションのタイムスタンプとして設定され、Amazon Personalize はそれを新しいアイテムとみなします。

カテゴリ別メタデータ

特定のレシピとドメインでは、Amazon Personalize は、ユーザーにとって最も関連性の高いアイテムを明らかにする基本的なパターンを識別する際に、アイテムのジャンルや色などのカテゴリメタデータを使用します。ユースケースに基づいて独自の値の範囲を定義します。カテゴリメタデータは任意の言語で記述できます。

すべてのレシピとドメインで、カテゴリデータをインポートし、それを使用してアイテムの属性に基づいてレコメンデーションをフィルタリングできます。フィルタリングのレコメンデーションについては、「レコメンデーションとユーザーセグメントのフィルタリング」を参照してください。

カテゴリ値には、最大 1000 文字まで入力できます。1000 文字を超えるカテゴリ値を持つアイテムがある場合、データセットのインポートジョブは失敗します。

ドメインデータセットグループについては、VIDEO_ON_DEMAND ドメインと ECOMMERCE ドメインの両方がカテゴリメタデータを使用します。カスタムデータセットグループおよびカスタムソリューションについては、カテゴリメタデータを使用するレシピには次のものが含まれます。

非構造化テキストメタデータ

特定のレシピとドメインを使用すると、Amazon Personalize は、製品の説明、製品のレビュー、映画のあらすじなど、非構造化テキストメタデータから有意義な情報を抽出できます。Amazon Personalize は、非構造化テキストを使用して、特にアイテムが新しい場合やインタラクションデータが少ない場合に、ユーザーに関連するアイテムを識別します。Items データセットに非構造化テキストデータを含めて、カタログ内の新しいアイテムのクリック率とコンバージョン率を高めます。

非構造化データを使用するには、タイプ string のフィールドをアイテムスキーマに追加し、フィールドの textual 属性を true に設定します。その後、テキストデータをバルク CSV ファイルと個々のアイテムインポートに含めます。バルク CSV ファイルについては、テキストを二重引用符で囲みます。\ 文字を使用して、データ内の二重引用符または \ 文字をエスケープします。非構造化テキストデータのフィールドを持つ Items スキーマの例については、「Items データセットのスキーマの例 (カスタム)」を参照してください。Amazon Personalize は、テキストフィールドを文字数制限で切り捨てます。テキスト内の最も関連性の高い情報がフィールドの先頭にあることを確認してください。Amazon Personalize へのデータのインポートについては、「データの準備とインポート」を参照してください。

非構造化テキスト値を使用する前に、Amazon Personalize はテキストから以下を削除します。

  • HTML と XML のタグとエンティティ

  • 改行、タブ、および余分なスペース文字

非構造化テキストの値は、中国語と日本語を除くすべての言語で最大 20,000 文字です。中国語と日本語では、最大 7,000 文字まで入力できます。Amazon Personalize は、文字数制限を超える値を文字数制限まで切り捨てます。

テキストには次の言語を使用できます。

  • 簡体字中国語

  • 繁体字中国語

  • 英語

  • フランス語

  • ドイツ語

  • 日本語

  • ポルトガル語

  • スペイン語

非構造化テキストアイテムは複数の言語で送信できますが、各アイテムのテキストは 1 つの言語のみである必要があります。

ドメインデータセットグループについては、VIDEO_ON_DEMAND ドメインと ECOMMERCE ドメインの両方がテキストメタデータを使用します。カスタムデータセットグループおよびカスタムソリューションについては、テキストメタデータを使用するレシピには次のものが含まれます。