OPS08-BP03 分析工作負載追蹤 - AWS Well-Architected 架構

OPS08-BP03 分析工作負載追蹤

對於獲得應用程式操作之旅全面性的總覽來說,分析追蹤資料是相當重要的一環。透過視覺化和了解各種不同元件之間的互動,就能微調效能、找出瓶頸,並且增強使用者體驗。

期望的結果:清楚掌握應用程式的分散式操作,就能更快解決問題並增強使用者體驗。

常見的反模式:

  • 忽略追蹤資料,只依賴日誌和指標。

  • 未將追蹤資料與相關的日誌建立關聯。

  • 忽略從追蹤產生的指標,如延遲和故障率。

建立此最佳實務的優勢:

  • 改善疑難排解並縮短平均解決時間 (MTTR)。

  • 獲得深入相依性及其影響的洞見。

  • 快速找出並糾正效能問題。

  • 利用追蹤產生的指標做出明智的決策。

  • 透過最佳化元件互動改善使用者體驗。

未建立此最佳實務時的風險暴露等級:

實作指引

AWS X-Ray 提供了全方位的追蹤資料分析套件,能讓您深入了解服務互動的各個層面、監控使用者活動,以及偵測效能問題。像是 ServiceLens、X-Ray Insights、X-Ray Analytics 及 Amazon DevOps Guru 等功能可從追蹤資料產生更深入且可付諸行動的洞見。

實作步驟

下列步驟提供了結構化的方法,以使用 AWS 服務有效實作追蹤資料分析:

  1. 整合 AWS X-Ray:確保 X-Ray 與您的應用程式整合以擷取追蹤資料。

  2. 分析 X-Ray 指標:使用服務地圖監控應用程式健全狀態,深入了解從 X-Ray 追蹤衍生的指標,例如延遲、請求率、故障率和回應時間分佈。

  3. 使用 ServiceLens:利用服務地圖來增強服務和應用程式的可觀測性。如此就能將追蹤、指標、日誌、警報和其他運作狀況資訊整合在一起檢視。

  4. 啟用 X-Ray Insights

    1. 開啟 X-Ray Insights 以在追蹤中自動偵測異常狀況。

    2. 檢查洞見以找出明確的模式並確定根本原因,例如故障率或延遲增加。

    3. 請參考洞察時間軸,依時間順序查看所偵測到問題的分析。

  5. 使用 X-Ray AnalyticsX-Ray Analytics 可讓您徹底探索追蹤資料、找出明確的模式,以及擷取洞見。

  6. 使用 X-Ray 中的群組:在 X-Ray 中建立群組,即可根據如高延遲等條件篩選追蹤,以進行更針對性的分析。

  7. 併入 Amazon DevOps Guru:參與 Amazon DevOps Guru 以便利用機器學習模型的優勢,從追蹤中找出明確的操作異常狀況。

  8. 使用 CloudWatch Synthetics:使用 CloudWatch Synthetics建立可持續監控端點和工作流程的 Canary。這些 Canary 可與 X-Ray 整合,以提供追蹤資料,用來對要測試的應用程式進行深入分析。

  9. 使用真實使用者監控 (RUM):使用 AWS X-Ray 和 CloudWatch RUM,您可以透過下游受 AWS 管理服務,從應用程式的最終使用者開始分析和除錯請求路徑。這樣做有助於找出影響最終使用者的延遲趨勢和錯誤。

  10. 與日誌檔關聯: 追蹤資料與 X-Ray 追蹤檢視中的相關日誌相關聯,以獲得應用程式行為的精細視角。如此可讓您檢視與追蹤的交易直接相關的日誌事件。

  11. 實作 CloudWatch 跨帳戶可觀測性監控和疑難排解區域內跨多個帳戶的應用程式。

實作計畫的工作量:

資源

相關的最佳實務:

相關文件:

相關影片:

相關範例: