バルクデータの準備とインポート - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

バルクデータの準備とインポート

データセットを作成すると、バルク履歴データの Amazon Personalize へのインポートを開始する準備が整います。バルクレコードのインポートには、次の 2 つの選択肢があります。

  • アイテムインタラクション、ユーザー、アイテムデータセットについては、Amazon SageMaker Data Wrangler を使用すると、40 を超えるソースからデータをインポートし、ビジュアライゼーションと Amazon Personalize 固有のインサイトを生成し、Amazon Personalize の要件を満たすようにデータを変換できます。

  • すべてのデータセットタイプで、バルクデータをデータセットに直接インポートできます。直接インポートする場合は、Amazon Personalize の要件を満たすようにデータを手動でフォーマットし、Amazon S3 にアップロードします。次に、スキーマとデータセットを作成し、データセットインポートジョブを使用してデータをデータセットに直接インポートします。

次のガイドラインは、バルクデータが正しくフォーマットされていることを確認するのに役立ちます。

  • 入力データはコンマ区切り値 (CSV) ファイルである必要があります。

  • CSV ファイルの最初の行には、列ヘッダーが含まれている必要があります。ヘッダーを引用符 (") で囲まないでください。

  • データセットタイプに必要なフィールドがあることを確認し、その名前が Amazon Personalize の要件と一致していることを確認してください。例えば、アイテムデータには、各アイテムの ID を持つ ITEM_IDENTIFICATION_NUMBER と呼ばれる列を含むことがあります。この列を ITEM_ID フィールドとして使用するには、列の名前を ITEM_ID に変更します。Data Wrangler を使用してデータをフォーマットする場合は、Amazon Personalize Data Wrangler のマップ列変換を使用して、列に正しい名前が付けられていることを確認できます。

    必要なフィールドについての詳細は、「 スキーマ」を参照してください。Data Wrangler を使用してデータを準備する方法については、「Amazon SageMaker Data Wrangler を使用したデータの準備およびインポート」を参照してください。

  • CSV ファイルの列ヘッダー名は、スキーマに対応している必要があります。

  • CSV ファイルの各レコードは 1 行にする必要があります。

  • 各列のデータ型はスキーマに対応している必要があります。Data Wrangler を使用してデータをフォーマットする場合、Data Wrangler 変換の Parse Value as Type を使用してデータ型を変換できます

  • TIMESTAMP および CREATION_TIMESTAMP データは UNIX エポック時間形式である必要があります。詳細については、「タイムスタンプのデータ」を参照してください。

  • データに ASCII でエンコードされていない文字が含まれている場合は、CSV ファイルを UTF-8 形式でエンコードする必要があります。

  • テキストデータは必ず、非構造化テキストメタデータ で説明されているとおりにフォーマットしてください。

  • インプレッションデータとカテゴリデータは、明示的なインプレッションのフォーマットカテゴリ別データのフォーマット で説明されているとおりにフォーマットしてください。

Amazon Personalize の一括データフォーマット要件の詳細については、「データ形式ガイドライン」を参照してください。

Amazon Personalize データセットにデータをインポートしたら、分析、Amazon S3 バケットへのエクスポート、更新、またはデータセットの削除による削除を行うことができます。詳細については、「データを管理する」を参照してください。

レコメンダーをすでに作成しているか、キャンペーンを含むカスタムソリューションバージョンをデプロイしている場合、新しい一括レコードがレコメンデーションにどのように影響するかは、使用するドメインのユースケースまたはレシピによって異なります。詳細については、「リアルタイムイベントがレコメンデーションに与える影響」を参照してください。

一括レコードのフィルター更新

一括インポートの完了から 20 分以内に、Amazon Personalize は、データセットグループで作成したすべてのフィルターを、新しいアイテムおよびユーザーデータで更新します。この更新により、Amazon Personalize はユーザーのレコメンデーションをフィルタリングする際に最新のデータを使用できるようになります。