輸送量太慢 - Managed Service for Apache Flink

Amazon Managed Service for Apache Flink 之前稱為 Amazon Kinesis Data Analytics for Apache Flink。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

輸送量太慢

如果應用程式處理傳入的串流資料速度不夠快,它會效能不佳且變得不穩定。本節說明此狀況的徵狀和疑難排解步驟。

徵狀

這種情況可能有下列徵狀:

  • 如果應用程式的資料來源是 Kinesis 串流,則串流的 millisbehindLatest 指標會持續增加。

  • 如果應用程式的資料來源是 Amazon MSK 叢集,則叢集的取用者延遲指標會持續增加。如需詳細資訊,請參閱 Amazon MSK 開發人員指南中的取用者延遲監控

  • 如果應用程式的資料來源是其他服務或來源,請檢查任何可用的取用者延遲指標或可用資料。

原因和解決方案

造成應用程式輸送量緩慢的原因可能有很多。如果應用程式未與輸入保持一致,請檢查以下內容:

  • 如果輸送量延遲急劇增加,然後逐漸減少,請檢查應用程式是否正在重新啟動。應用程式在重新啟動時會停止處理輸入,進而造成延遲急劇增加。如需應用程式故障的相關資訊,請參閱應用程式重新啟

  • 如果輸送量延遲一致,請檢查應用程式是否已進行效能最佳化。如需最佳化應用程式效能的相關資訊,請參閱效能疑難排

  • 如果輸送量延遲未急劇增加,而是持續增加,並且應用程式已進行效能最佳化,則必須增加應用程式資源。如需增加應用程式資源的相關資訊,請參閱擴展

  • 如果應用程式從不同區域的 Kafka 叢集讀取,並且儘管取用者延遲很高,FlinkKafkaConsumerKafkaSource 大多是閒置狀態 (高 idleTimeMsPerSecond 或低 CPUUtilization),則可以增加 receive.buffer.byte 的值,例如 2097152。如需詳細資訊,請參閱自訂 MSK 組態中的「高延遲環境」一節。

如需應用程式來源中輸送量緩慢或取用者延遲增加的疑難排解步驟,請參閱效能疑難排