翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
注記
Firehose は、中国リージョン AWS GovCloud (US) Regions、アジアパシフィック (マレーシア) AWS リージョンを除くすべての で、ソースとしてデータベースをサポートしています。この機能はプレビュー版であり、変更される可能性があります。本番稼働用ワークロードには使用しないでください。
組織はリレーショナルデータベースを使用して、一度に 1 行または数行のデータと非常に迅速にやり取りするように最適化されたトランザクションデータを保存および取得します。大量の集計データをクエリするために最適化されていません。組織は、トランザクションデータをリレーショナルデータベースからデータレイク、データウェアハウス、分析や機械学習のユースケースのためのその他のツールなどの分析データストアに移動します。分析データストアをリレーショナルデータベースと同期させるために、データベースへのすべての変更をリアルタイムでキャプチャできる変更データキャプチャ (CDC) と呼ばれる設計パターンが使用されます。ソースデータベースの INSERT、UPDATE、または DELETE を介してデータを変更する場合、それらの CDC の変更はデータベースのパフォーマンスに影響を与えることなく継続的にストリーミングする必要があります。
Firehose は、MySQL および PostgreSQL easy-to-useend-to-endのソリューションを提供します。この機能を使用すると、Firehose で CDC イベントにキャプチャする特定のデータベース、テーブル、列を選択できます。Iceberg テーブルをまだお持ちでない場合は、Firehose に Iceberg テーブルの作成をオプトインできます。Firehose は、リレーショナルデータベーステーブルと同じスキーマを使用してデータベースとテーブルを作成します。ストリームが作成されると、Firehose はテーブル内のデータの最初のコピーを取得し、Apache Iceberg テーブルに書き込みます。最初のコピーが完了すると、Firehose はデータベース内のリアルタイムの CDC 変更の継続的なキャプチャを開始し、それらを Apache Iceberg テーブルにレプリケートします。スキーマの進化をオプトインすると、Firehose はリレーショナルデータベースのスキーマの変更に基づいて Iceberg テーブルスキーマを進化させます。
Firehose は、MySQL データベースと PostgreSQL データベースから Amazon S3 テーブルに変更をレプリケートすることもできます。Amazon S3 テーブルは、大規模な分析ワークロードに最適化されたストレージを提供します。また、クエリのパフォーマンスを継続的に向上させ、表形式のデータのストレージコストを削減する機能を備えています。Apache Iceberg の組み込みサポートにより、Amazon S3 の表形式データをクエリできます。 Amazon Athena Amazon S3 テーブルの詳細については、Amazon S3テーブル」を参照してください。Firehose と Amazon S3 テーブルの統合は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン) の各リージョンでプレビュー中です。本番稼働用ワークロードには使用しないでください。
Amazon S3 テーブルの場合、Firehose はテーブルの自動作成をサポートしていません。Firehose ストリームを作成する前に、S3 テーブルを作成する必要があります。