データ配信の一時停止と再開 - Amazon Data Firehose

Amazon S3 の Apache Iceberg テーブルへの Amazon Data Firehose ストリームの配信はプレビュー中であり、変更される可能性があります。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データ配信の一時停止と再開

Firehose ストリームを設定すると、ストリームソースで利用可能なデータが送信先に継続的に配信されます。ストリームの送信先が一時的に使用できない状況 (計画的メンテナンスなど) になった場合は、データ配信を一時的に停止し、送信先が再び使用できるようになったら再開してください。

重要

以下に説明する方法を使用してストリームを一時停止および再開すると、ストリームを再開した後、Amazon S3 のエラーバケットに配信されるレコードはほとんどなく、残りのストリームは引き続き送信先に配信されます。これは、このアプローチの既知の制限であり、複数回の再試行後に送信先に以前に配信できなかった少数のレコードが失敗として追跡されたために発生します。

Firehose ストリームを一時停止する

Firehose でストリーム配信を一時停止するには、まず Firehose が配信に失敗した S3 バックアップ場所に書き込むためのアクセス許可を削除します。例えば、 OpenSearch 送信先で Firehose ストリームを一時停止する場合は、アクセス許可を更新することでこれを行うことができます。詳細については、「パブリック OpenSearch サービスの送信先 へのアクセスを Firehose に許可する」を参照してください。

アクション s3:PutObject のアクセス許可 "Effect": "Allow" を削除し、アクション s3:PutObject のアクセス許可 Effect": "Deny" を、配信に失敗した場合に使用する S3 バケットに適用するステートメントを明示的に追加します。次に、ストリームの送信先をオフにするか (送信先 OpenSearch ドメインをオフにするなど)、Firehose が送信先に書き込むためのアクセス許可を削除します。他の送信先のアクセス許可を更新するには、「Amazon Data Firehose によるアクセスの制御」で送信先の セクションを確認してください。これら 2 つのアクションを完了すると、Firehose はストリームの配信を停止し、CloudWatch Firehose のメトリクスを使用してこれをモニタリングできます。

重要

Firehose でストリーム配信を一時停止する場合、ストリームの送信元 (Kinesis Data Streams や Managed Service for Kafka など) が、ストリーム配信が再開され、データが送信先に配信されるまでデータを保持するように設定されていることを確認する必要があります。ソースが Direct の場合PUT、Firehose はデータを 24 時間保持します。データ保持期間内にストリームを再開してデータを配信しなければ、データが失われる可能性があります。

Firehose ストリームを再開する

配信を再開するには、まず送信先をオンにし、Firehose が送信先にストリームを配信するアクセス許可を持っていることを確認して、ストリームの送信先に以前に行った変更を元に戻します。次に、失敗した配信をバックアップする S3 バケットに適用されたアクセス許可に対して、以前に行った変更を元に戻します。つまり、アクション s3:PutObject のアクセス許可 "Effect": "Allow" を適用し、配信に失敗した場合に使用する S3 バケットに対するアクション s3:PutObject のアクセス許可 "Effect": "Deny" を削除します。最後に、CloudWatch Firehose のメトリクスを使用してモニタリングし、ストリームが送信先に配信されていることを確認します。エラーを表示およびトラブルシューティングするには、Firehose の Amazon CloudWatch Logs モニタリングを使用します。