オフラインストア - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

オフラインストア

オフラインストアは、1 秒以内に取得する必要がない場合の履歴データに使用されます。通常、データ探索、モデルトレーニング、バッチ推論に使用されます。

特徴量グループでオンラインストアとオフラインストアの両方を有効にすると、トレーニングとデータ提供の間の不一致を避けるため、両方のストアが同期されます。現在、InMemory ストレージタイプが有効になっているオンラインストア特徴量グループは、オフラインストアの対応する特徴量グループをサポートしていないことに注意してください (オンラインからオフラインへのレプリケーションはできません)。Amazon SageMaker Feature Store での ML モデルサービスの詳細については、「」を参照してくださいオンラインストア

オフラインストアには以下の TableFormat のオプションがあります。オフラインストアの内容の詳細については、Amazon SageMaker API リファレンスOfflineStoreConfigの「」を参照してください。

Glue テーブル形式

Glue 形式 (デフォルト) は AWS Glueの標準的な Hive タイプのテーブル形式です。を使用すると AWS Glue、複数のソースからのデータを検出、準備、移動、統合できます。また、ジョブの作成、実行、ビジネスワークフローの実装のための生産性向上に役立つツールやデータ運用ツールも追加されています。の詳細については AWS Glue、「 AWS Glueとは」を参照してください。

Iceberg テーブル形式

Iceberg 形式 (推奨) は、非常に大きな分析テーブル用のオープンテーブル形式です。Iceberg では、パーティション内の小さなデータファイルを少数の大きなファイルに圧縮できるため、クエリが大幅に速くなります。この圧縮操作は同時に実行され、特徴量グループでの進行中の読み取り/書き込み操作には影響しません。Iceberg テーブルの最適化の詳細については、Amazon AthenaAWS Lake Formationユーザーガイド」を参照してください。

Iceberg は大量のファイルコレクションをテーブルで管理して最新の分析データレイク操作をサポートします。新しい特徴量グループを作成するときに Icebergオプションを選択すると、Amazon SageMaker Feature Store は Parquet ファイル形式を使用してIcebergテーブルを作成し、テーブルを に登録します AWS Glue Data Catalog。Iceberg テーブル形式の詳細については、「Apache Iceberg テーブルの使用」を参照してください。

重要

Iceberg テーブル形式の特徴量グループでは、イベント時刻の値として String を指定する必要があることに注意してください。他のタイプを指定すると、特徴量グループを正常に作成できません。