Amazon S3 への DynamoDB データのエクスポート: 仕組み - Amazon DynamoDB

Amazon S3 への DynamoDB データのエクスポート: 仕組み

DynamoDB テーブルのエクスポートを使用すると、Amazon DynamoDB テーブルのデータをポイントインタイムリカバリウィンドウ内の任意の時点から Amazon S3 バケットにエクスポートできます。DynamoDB テーブルを S3 バケットにエクスポートすると、Athena、AWS Glue、Lake Formation などの他の AWS サービスを使用して、データの分析や複雑なクエリを有効にできます。DynamoDB テーブルのエクスポートは、DynamoDB テーブルを大規模にエクスポートするための完全マネージド型ソリューションであり、テーブルスキャンに関連する他の方法よりもはるかに高速です。

テーブルをエクスポートしても、テーブルの読み込み容量は消費されず、テーブルのパフォーマンスと可用性には影響しません。テーブルデータは、別の AWS アカウントが所有する S3 バケットや、テーブルがあるリージョンとは異なるリージョンにエクスポートできます。データは常にエンドツーエンドで暗号化されます。

DynamoDB テーブルをエクスポートするには、AWS Management Console、AWS Command Line Interface、または DynamoDB API のいずれかを使用します。詳細については、「DynamoDB でテーブルのエクスポートをリクエストする」を参照してください。

使用可能な AWS リージョンおよび料金に関する詳細については、Amazon DynamoDB 料金表を参照してください。

Amazon DynamoDB テーブルから Amazon S3 バケットにデータをエクスポートするには、ソーステーブルでポイントインタイムリカバリ(PITR)を有効にする必要があります。PITR ウィンドウ内の任意の時点から、最大 35 日までのテーブルデータをエクスポートできます。詳細については、「DynamoDB のポイントインタイムリカバリ」を参照してください。

DynamoDB JSON 形式または Amazon Ion テキスト形式のどちらでデータをエクスポートするかを選択できます。エクスポート形式の詳細については、「データオブジェクト」を参照してください。

別のアカウントによって所有されている S3 バケットにデータをエクスポートするには、そのバケットに書き込むための正しい許可が必要です。コピー先バケットは、コピー元テーブルとは異なるリージョンに存在する可能性があります。詳細については、「Amazon S3 セットアップとアクセス許可」を参照してください。

最大 300 個のエクスポートタスク、または最大 100 TB のテーブルサイズを同時にエクスポートできます。

データレイクエクスポートリクエストに含まれるリクエスト時刻と最終更新時刻は、1 分の時間枠内で異なる場合があります。たとえば、午後 2:25 にリクエストを送信すると、2:24 までにテーブルにコミットされたすべてのデータが出力に含まれ、2:26 以降にコミットされたデータは含まれません。出力には、2:24~2:26 の間に行われたデータ変更が含まれる場合と含まれない場合があります。エクスポートされたデータにもトランザクションの一貫性がありません。

テーブルエクスポートのコンソールと API のアクションはすべて、AWS CloudTrail に記録され、ログ記録、継続的モニタリング、監査が有効になります。詳細については、「」を参照してくださいAWS CloudTrail を使用して DynamoDB オペレーションをログに記録する

DynamoDB テーブルのエクスポートは、テーブルスキャンを使用してテーブルをエクスポートするよりも高速な処理が行われるよう設計されています。エクスポートが完了するまでにかかる正確な時間は、テーブルの大きさとテーブルデータの分散方法によって異なります。ユースケースにリアルタイム分析が含まれる場合は、Amazon Kinesis Data Streams を使用できます。詳細については、「Amazon Kinesis Data Streams デベロッパーガイド」を参照してください。

Amazon S3 に関する詳細は、「Amazon Simple Storage Service ユーザーガイド」を参照してください。