階段 4:操作 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

階段 4:操作

此階段著重於您的系統用來維護和改善彈性的操作實務。建立卓越營運的文化有助於建立這些實務的標準和一致性。

可觀測性

若要有效測量彈性,請從伺服器端和用戶端監控您的應用程式。

針對伺服器端監控,請使用您偏好的基礎設施監控工具。使用這些工具,針對基礎設施或應用程式的任何關鍵效能指標 (KPIs) 違規設定儀表板、警示和通知。如果您使用的是 Amazon CloudWatch,請設定儀表板警示,以提供任何基礎設施或應用程式故障的提醒。

使用 Service Quotas, AWS 服務 它可協助您管理許多 的配額 AWS 服務。這有助於防止在擴展生產工作負載時發生服務配額問題 AWS。您也可以建立 CloudWatch 警示,以便在工作負載中達到關鍵服務的閾值時提醒您。

針對用戶端監控,請建立指令碼或 Canary 來監控應用程式是否有指標,例如可用性、頁面載入時間或中斷的連結,藉此設定合成監控。合成監控會持續遵循與客戶相同的路由和動作,來驗證客戶的體驗。您可以使用 Amazon CloudWatch Synthetics Canary 來視覺化監控您的應用程式。視覺化監控藍圖可協助您快速建立或更新 Canary,以比較執行中應用程式的螢幕擷取畫面與基準螢幕擷取畫面。您也可以使用 CloudWatch RUM 執行實際使用者監控,近乎即時地從實際使用者工作階段收集和檢視 Web 應用程式效能的用戶端資料。您可以視覺化和分析資料,例如頁面載入時間、用戶端錯誤和使用者行為。

其他資源:

持續彈性

使用 定期檢閱任務關鍵工作負載的彈性狀態 AWS Well-Architected Tool。也請考慮執行遊戲日來模擬您已建立彈性機制的已知事件。例如,您可以模擬可用區域受損並執行多可用區容錯移轉。雖然實作這些活動可能需要大量工作,但這兩種實務都能夠建立信心,讓您的工作負載能夠抵禦您設計為承受的故障模式。