Amazon Kinesis データストリームは、再シャーディング中にソース処理を順序どおりにストリーミングします - Managed Service for Apache Flink

Amazon Managed Service for Apache Flink は、以前は Amazon Kinesis Data Analytics for Apache Flink と呼ばれていました。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Kinesis データストリームは、再シャーディング中にソース処理を順序どおりにストリーミングします

現在の FlinkKinesisConsumer 実装では、Kinesis シャード間の強力な注文保証は提供されません。これにより、Kinesis Stream の再シャーディング中に、特に処理の遅延が発生する Flink アプリケーションに対して処理が行われる out-of-order可能性があります。たとえば、イベント時間に基づくウィンドウオペレーターのような状況下では、遅延が原因でイベントが破棄される可能性があります。

Diagram showing shards and shard consumers with time progression and trim horizon.

これはオープンソースの Flink の既知の問題です。コネクタの修正が利用可能になるまで、Flink アプリケーションが Kinesis データストリームのリパーティショニング中に遅れないようにすることが重要です。Flink アプリケーションが処理遅延を確実に許容することで、処理の影響 out-of-orderとデータ損失のリスクを最小限に抑えることができます。