OPS08-BP03 分析工作負載追蹤 - AWS Well-Architected 架構

OPS08-BP03 分析工作負載追蹤

對於獲得應用程式操作之旅全面性的總覽來說,分析追蹤資料是相當重要的一環。透過視覺化和了解各種不同元件之間的互動,就能微調效能、找出瓶頸,並且增強使用者體驗。

預期成果: 清楚掌握應用程式的分散式操作,就能更快解決問題並增強使用者體驗。

常見的反模式:

  • 忽略追蹤資料,只依賴日誌和指標。

  • 未將追蹤資料與相關的日誌建立關聯。

  • 忽略從追蹤產生的指標,如延遲和故障率。

建立此最佳實務的優勢:

  • 改善疑難排解並縮短平均解決時間 (MTTR)。

  • 獲得深入相依性及其影響的洞見。

  • 快速找出並糾正效能問題。

  • 利用追蹤產生的指標做出明智的決策。

  • 透過最佳化元件互動改善使用者體驗。

未建立此最佳實務時的曝險等級:

實作指引

AWS X-Ray 提供了全方位的追蹤資料分析套件,能讓您深入了解服務互動的各個層面、監控使用者活動,以及偵測效能問題。像是 ServiceLens、X-Ray Insights、X-Ray Analytics 及 Amazon DevOps Guru 等功能可從追蹤資料產生更深入且可付諸行動的洞見。

實作步驟

下列步驟提供了結構化的方法,以使用 AWS 服務有效實作追蹤資料分析:

  1. 整合 AWS X-Ray: 確保 X-Ray 與您的應用程式整合以擷取追蹤資料。

  2. 分析 X-Ray 指標: 深入研究從 X-Ray 追蹤產生的指標,例如延遲、請求率、故障率和回應時間分佈情形,方法是使用 服務圖 來監控應用程式運作狀況。

  3. 使用 ServiceLens: 利用 ServiceLens Map 加強服務和應用程式的可觀測性。如此就能將追蹤、指標、日誌、警報和其他運作狀況資訊整合在一起檢視。

  4. 啟用 X-Ray Insights:

    1. 開啟 X-Ray Insights 以便自動偵測追蹤內的異常情況。

    2. 檢查洞見以找出明確的模式並確定根本原因,例如故障率或延遲增加。

    3. 請參考 Insights 時間軸,依時間順序查看所偵測到問題的分析。

  5. 使用 X-Ray Analytics: X-Ray Analytics 可讓您徹底探索追蹤資料、找出明確的模式,以及擷取洞見。

  6. 使用 X-Ray 中的群組: 在 X-Ray 中建立群組,即可根據如高延遲等條件篩選追蹤,以進行更針對性的分析。

  7. 納入 Amazon DevOps Guru: 參與 Amazon DevOps Guru 以便利用機器學習模型的優勢,從追蹤中找出明確的操作異常狀況。

  8. 使用 CloudWatch Synthetics: 使用 CloudWatch Synthetics 建立 Canary 來持續監控您的端點和工作流程。這些 Canary 可與 X-Ray 整合,以提供追蹤資料,用來對要測試的應用程式進行深入分析。

  9. 使用實際使用者監控 (RUM): 透過 AWS X-Ray 和 CloudWatch RUM,您可以分析請求路徑並進行偵測,從應用程式的最終使用者開始,一路到下游 AWS 受管服務。這樣做有助於找出影響使用者的延遲趨勢和錯誤。

  10. 與日誌建立關聯:追蹤資料與 X-Ray 追蹤檢視內的相關日誌建立關聯,以透過更深入的觀點來了解應用程式行為。如此可讓您檢視與追蹤的交易直接相關的日誌事件。

實作計劃的工作量: 中。

資源

相關的最佳實務:

相關文件:

相關影片:

相關範例: