スループットが遅すぎる - Managed Service for Apache Flink

Amazon Managed Service for Apache Flink は、以前は Amazon Kinesis Data Analytics for Apache Flink と呼ばれていました。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

スループットが遅すぎる

アプリケーションが受信ストリーミングデータを十分な速さで処理しないと、パフォーマンスが低下し、不安定になります。このセクションでは、この状態の症状とトラブルシューティングの手順について説明します。

症状

この状態では、次の症状が発生する可能性があります。

  • アプリケーションのデータソースが Kinesis ストリームの場合、ストリームの millisbehindLatest メトリクスは継続的に増加します。

  • アプリケーションのデータソースが Amazon MSK クラスターの場合、クラスターのコンシューマーラグメトリクスは増え続けます。詳細については、「Amazon MSK 開発者ガイド」の「コンシューマーラグモニタリング」を参照してください。

  • アプリケーションのデータソースが別のサービスまたはソースである場合は、入手可能なコンシューマーラグのメトリクスまたはデータを確認してください。

原因と解決策

アプリケーションのスループットが遅くなる原因は多数あります。アプリケーションが入力に追いついていない場合は、次の点を確認してください。

  • スループットラグが急上昇し、その後次第に減少する場合は、アプリケーションが再起動しているかどうかを確認してください。アプリケーションは再起動中に入力の処理を停止するため、遅延が急増します。アプリケーションの障害については、「アプリケーションを再起動中」を参照してください。

  • スループットの遅延がずっと続く場合は、アプリケーションのパフォーマンスが最適化されているかどうかを確認してください。アプリケーションのパフォーマンスを最適化する方法については、 パフォーマンスのトラブルシューティング を参照してください。

  • スループットラグが急上昇しているのではなく継続的に増加していて、アプリケーションのパフォーマンスが最適化されている場合は、アプリケーションリソースを増やす必要があります。アプリケーションリソースを増やす方法については、 スケーリング を参照してください。

  • アプリケーションが別のリージョンの Kafka クラスターから読み取りを行ったり、コンシューマーラグが大きいにもかかわらず FlinkKafkaConsumer または KafkaSource がほとんどアイドル状態 (高い idleTimeMsPerSecond または低い CPUUtilization) になっている場合は、2097152 など receive.buffer.byte の値を増やすことができます。詳細については、「カスタム MSK 設定」の高レイテンシー環境セクションを参照してください。

アプリケーションソースのスループットが低下したり、コンシューマーラグが増加したりする場合のトラブルシューティング手順については、 パフォーマンスのトラブルシューティング を参照してください。