OPS04-BP02 實作應用程式遙測
應用程式遙測是工作負載可觀測性的基礎。提供遙測相當重要,因為能讓您獲得可付諸行動的洞見,深入了解應用程式的狀態以及實現的技術與業務成果。從疑難排解到衡量新功能的影響,或確保與業務關鍵績效指標 (KPI) 保持一致,應用程式遙測都能為您指出建置、操作和發展工作負載的方式。
指標,日誌和追蹤是構成可觀測性的三大要素。這些要素可做為診斷工具來描述應用程式的狀態。經過一段時間後,這些要素可協助建立基準和識別異常狀況。然而,為了確保監控活動與業務目標保持一致,就必須定義並監控 KPI。與單獨的技術指標相比,業務 KPI 通常更容易找出問題所在。
其他遙測類型 (例如實際使用者監控 (RUM) 和綜合交易) 可與這些主要資料來源相輔相成。RUM 提供即時使用者互動的洞見,而綜合交易則模擬可能的使用者行為,有助於在實際使用者遇到瓶頸之前便偵測到瓶頸。
預期成果: 獲得工作負載效能且可付諸行動的洞見。這些洞見可讓您做出有關效能最佳化的主動決策、提高工作負載穩定性、使 CI/CD 程序更順暢,並且有效利用資源。
常見的反模式:
-
不完整的可觀測性:忽略在工作負載的每一層納入可觀測性,導致出現可能遮蔽重要系統效能和行為洞見的盲點。
-
分散的資料檢視:當資料分散在多個工具和系統中時,便難以提供涵蓋工作負載運作狀況和效能的全面概覽。
-
使用者回報的問題:這種現象表示未能透過遙測和業務 KPI 監視進行主動問題偵測。
建立此最佳實務的優勢:
-
明智的決策:透過遙測和業務 KPI 獲得洞見,就能做出資料驅動的決策。
-
改善運作效率:資料驅動的資源利用率可帶來成本效益。
-
提高工作負載穩定性:更快偵測並解決問題,進而改善正常運作。
-
更順暢的 CI/CD 程序:從遙測資料獲得的洞見,有助於改進程序並交付可靠的程式碼。
未建立此最佳實務時的曝險等級: 高
實作指引
若要為您的工作負載實作應用程式遙測,請使用類似以下的 AWS 服務: Amazon CloudWatch
實作步驟
-
確定要收集的資料: 確定可提供工作負載運作狀況、效能和行為實質洞見的重要指標、日誌和追蹤。
-
部署 CloudWatch
代理程式: CloudWatch 代理程式的作用在於,方便您從工作負載及其基礎設施中取得系統和應用程式指標和日誌。CloudWatch 代理程式也可用來收集 OpenTelemetry 或 X-Ray 追蹤,並傳送至 X-Ray。 -
使用 AWS X-Ray 檢測您的應用程式: 除了部署 CloudWatch 代理程式之外,務必也要 檢測您的應用程式 以產生追蹤資料。此程序可提供工作負載行為和效能的進一步洞見。
-
將整個應用程式的資料收集標準化: 將整個應用程式的資料收集實務標準化。採取一致的方式有助於找出資料關聯並進行分析,進而提供應用程式行為的全面概覽。
-
分析資料並採取行動: 一旦有了資料收集和標準化的方式,就可使用 Amazon CloudWatch
進行指標和日誌分析,以及使用 AWS X-Ray 進行追蹤分析。這類分析可產生有關工作負載運作狀況、效能和行為的洞見,進而引導您進行決策。
實作計劃的工作量: 高
資源
相關的最佳實務:
相關文件:
相關影片:
相關範例: