ゼロ ETL 統合 - Amazon Redshift

ゼロ ETL 統合

このトピックでは、プレビューリリースバージョンの Aurora PostgreSQL と Amazon Redshift との ゼロ ETL 統合に関するプレリリースドキュメントを扱っています。ドキュメントと機能はどちらも変更される場合があります。Aurora PostgreSQL のゼロ ETL 統合については、本番環境ではなくテスト環境でのみ使用することをお勧めします。プレビューの利用規約については、「AWS のサービス条件」の「ベータ版とプレビュー」を参照してください。

ゼロ ETL 統合は、トランザクションデータまたは運用データを Amazon Redshift でほぼリアルタイムで利用できるようにするフルマネージドソリューションです。このソリューションを使用して、ソースから Amazon Redshift データウェアハウスへの統合を設定できます。抽出、変換、ロード (ETL) パイプラインを管理する必要はありません。データソースから Amazon Redshift クラスターまたは Redshift Serverless 名前空間にデータレプリケーションの作成と管理を自動化することにより、お客様に代わって ETL が処理されます。レポートやダッシュボードなどの分析ワークロードには Amazon Redshift を使用して、ソースデータの更新とクエリを継続できます。

ゼロ ETL 統合では、分析、AI/ML、レポート作成用の新しいデータが得られます。リアルタイムダッシュボード、最適化されたゲームエクスペリエンス、データ品質のモニタリング、顧客行動分析などのユースケース用に、より正確でタイムリーなインサイトが得られます。ビジネス全体で、データ駆動型の予測をより自信を持って実行し、カスタマーエクスペリエンスを向上させ、データ駆動型のインサイトを促進できます。

ゼロ ETL 統合では現時点で、次のソースがサポートされています。

  • Aurora MySQL 互換エディション

  • Aurora PostgreSQL 互換エディション (プレビューバージョン)

  • RDS for MySQL

ゼロ ETL 統合を作成するには、統合ソースと、ターゲットとして Amazon Redshift データウェアハウスを指定します。この統合では、ソースデータベースからターゲットデータウェアハウスにデータがレプリケートされます。数秒以内にデータが Amazon Redshift で利用できるようになります。統合では、データパイプラインの状態をモニタリングし、可能な場合は問題から回復します。同種ソースから単一の Amazon Redshift データウェアハウスに統合を作成して、複数のアプリケーションにわたって総合的なインサイトを引き出すことができます。

Amazon Redshift のデータを使用して、Amazon Redshift が提供する分析を利用できます。例えば、組み込みの機械学習 (ML)、マテリアライズドビュー、データ共有、複数のデータストアやデータレイクへの直接アクセスなどが利用できます。ゼロ ETL 統合を使用すると、コンピューティングリソースをデータリソースから分離できるため、最も効率的なツールを使用してデータを処理できます。データエンジニアの場合、ゼロ ETL 統合を使用して、複雑なデータパイプランでの断続的なエラーを原因とする遅延が発生する可能性のある、時間的制約のあるデータにアクセスできます。トランザクションデータに対して分析クエリや機械学習モデルを実行して、時間的制約のあるイベントやビジネス上の意思決定について、ほぼリアルタイムのインサイトを引き出すことができます。

Amazon Redshift イベント通知サブスクリプションを作成すると、特定のゼロ ETL 統合でのイベント発生時に通知を受け取ることができます。統合関連のイベント通知のリストを確認するには、「Amazon EventBridge によるイベント通知のゼロ ETL 統合」を参照してください。サブスクリプションを作成する最も簡単な方法は、Amazon SNS コンソールを使用する方法です。Amazon SNS トピックの作成とサブスクリプションについては、「Amazon Simple Notification Service デベロッパーガイド」の「Amazon SNS の開始方法」を参照してください。

ゼロ ETL 統合を始める際には、以下の概念を検討してください。

  • ソースデータベースとは、データが Amazon Redshift にレプリケートされるデータベースです。

  • ターゲットデータウェアハウスとは、データがレプリケートされる Amazon Redshift でプロビジョンされたクラスターまたは Redshift Serverless ワークグループです。

  • 送信先データベースとは、ターゲットデータウェアハウスのゼロ ETL 統合から作成するデータベースです。

ゼロ ETL 統合のモニタリングに使用できるシステムテーブルとビューについては、「Amazon Redshift システムビューとのゼロ ETL 統合のモニタリング」を参照してください。

ゼロ ETL 統合の価格の情報については、次の該当する料金ページを参照してください。

ゼロ ETL 統合のソースの詳細については、次のトピックを参照してください。