本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控的最佳實務 AWS CloudHSM
監控最佳實務可以改善 AWS CloudHSM 叢集的安全性、效能和可靠性。遵循 AWS CloudHSM 文件中的AWS CloudHSM 監控最佳實務。此外,下列是可協助您有效監控 AWS CloudHSM 資源的一些重要準則:
-
建立基準 – 設定每個工作負載的基準指標和閾值,例如預期的工作階段金鑰、權杖金鑰和開放工作階段的數量。
-
當工作負載結果處於風險時發出警示 – 設定 Amazon CloudWatch 警示,以在工作負載指標超過已建立的閾值時啟動通知。這些提醒應該會通知您操作或效能問題或潛在的安全風險,例如惡意活動。
-
檢閱和修訂指標 – 定期檢閱監控資料,以評估已建立指標的有效性。指標應反映 AWS CloudHSM 叢集的運作狀態和效能。根據不斷變化的工作負載模式和操作需求調整指標。這可提升最佳監控和警示功能。
本指南 AWS CloudHSM 中的 監控和提醒建議遵循下列 AWS Well-Architected Framework
-
卓越營運支柱建議您的工作負載應設計成包含遙測和監控。 AWS CloudHSM 提供必要的資訊,例如指標、日誌、事件和追蹤,讓您了解資源的狀態。如需詳細資訊,請參閱 AWS CloudHSM 文件中的監控 AWS CloudHSM。當您操作時 AWS CloudHSM,您需要能夠了解叢集運作狀態、偵測操作事件,以及同時回應計劃和非計劃事件。 AWS 提供監控工具,協助您判斷組織和業務成果何時可能面臨風險,讓您可以在正確的時間採取適當的動作。
-
效能效率支柱建議您透過近乎即時的收集、彙總和處理效能相關指標,來監控資源的效能,例如 AWS CloudHSM 叢集。您可以識別效能降低並修復因素。例如,您可以偵測叢集中報告伺服器端錯誤的硬體安全模組 (HSMs)。您可以在測量超出預期閾值時自動發出警示。建議您不僅將警示用於通知,也要啟動自動動作以回應偵測到的事件。例如,您可以自動增加叢集中的 HSMs 數量。
-
可靠性支柱將監控和提醒定義為關鍵,以確保您符合可用性需求。您的監控解決方案必須能夠有效地偵測失敗。當它偵測到問題或失敗時,其主要目標是提醒這些問題。實作持續可觀測性和監控實務對於雲端中的彈性架構至關重要。若要改善工作負載,您必須能夠測量工作負載,並了解其狀態和運作狀態。從故障、水平可擴展性和容量佈建自動復原的設計原則取決於準確的監控和提醒服務。
-
安全支柱討論偵測和防止意外或不想要的組態變更,以及意外行為。根據預設, 會 AWS CloudHSM 收集您的 HSM 稽核日誌,並代表您將其傳送至 Amazon CloudWatch Logs。您可以使用稽核日誌來監控叢集中每個 HSM 內執行的操作。