本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS 服務的彈性檢查
本章提供 AWS Resilience Hub 為支援 AWS 的服務執行的各種彈性檢查的詳細資訊,以確保應用程式的彈性狀態不受影響。這些檢查會根據每個應用程式元件 (AppComponent) 彈性政策中定義的值,預估復原時間目標 (RTO) 和復原點目標 (RPO)。評估包含不同類型的中斷,即應用程式、基礎設施故障、可用區域中斷和區域故障。不過,若要執行這些檢查,您必須提供相關的 IAM 許可給 AWS Resilience Hub ,以允許其存取您的 資源。若要進一步了解允許 AWS Resilience Hub 存取您的資源並執行本章中的復原能力檢查所需的 IAM 許可,請參閱 AWS 的 受管政策 AWS Resilience Hub。
AWS 服務
Amazon Elastic File System
本節列出 Amazon Elastic File System 特有的所有彈性檢查和建議。如需 Amazon Elastic File System 的詳細資訊,請參閱 Amazon Elastic File System 文件。
檔案系統類型
AWS Resilience Hub 會檢查檔案系統類型:區域或單區域。檔案系統類型會影響其在基礎設施或可用區域中斷時的彈性。如需檔案系統類型的詳細資訊,請參閱 Amazon EFS 檔案系統的可用性和耐久性。
檔案系統備份
AWS Resilience Hub 會檢查是否已為部署的檔案系統定義 AWS Backup 計劃。此外,它會驗證Cross-Region
備份選項是否已啟用,確保政策需要時涵蓋區域層級中斷。
資料複寫
AWS Resilience Hub 會檢查是否已為部署的檔案系統定義區域內或跨區域 Amazon EFS 資料複寫。Amazon EFS 資料複寫有助於改善應用程式、基礎設施、AZ 和區域層級的預估 RTO 和預估 RPO。此外, 會 AWS Resilience Hub 檢查它是否與區域內的 結合 AWS Backup ,以便在應用程式中斷時啟用檔案系統彈性。
Amazon Relational Database Service 和 Amazon Aurora
本節列出 Amazon Relational Database Service 和 Amazon Aurora 特有的所有彈性檢查和建議。如需 Amazon Relational Database Service 和 Amazon Aurora 的詳細資訊,請參閱 Amazon Relational Database Service 文件。
單一可用區部署
AWS Resilience Hub 會檢查資料庫是否部署為單一執行個體,如果確定,則表示資料庫不支援次要執行個體和僅供讀取複本。
Multi-AZ deployment (異地同步備份部署)
AWS Resilience Hub 會檢查資料庫是否與次要執行個體或僅供讀取複本一起部署。如果使用僅供讀取複本部署資料庫, 會 AWS Resilience Hub 驗證其是否部署在不同 AZ 中,以便在 AZ 中斷時允許容錯移轉。
備份
AWS Resilience Hub 會檢查下列備份功能是否套用至部署的資料庫執行個體。
-
AWS Backup 具有自動備份選項的計劃
-
AWS Backup 如果您的政策要求,則使用跨區域備份複本進行規劃
-
第三方備份系統的手動快照
跨區域容錯移轉
AWS Resilience Hub 會檢查彈性政策中定義的 RTO 和 RPO 目標,以從區域中斷中復原。此外, AWS Resilience Hub 可以識別下列跨區域架構,以涵蓋區域中斷:
-
具有跨區域快照副本的區域內備份
-
另一個區域中的僅供讀取複本
-
在另一個區域中具有次要叢集的 Amazon Aurora 全域資料庫
-
Amazon Aurora 全域資料庫,在另一個區域中具有無周邊次要叢集
更快速的區域內容錯移轉
AWS Resilience Hub 在基礎設施或 AZ 中斷期間, 會檢查彈性政策中定義的 RTO 和 RPO 目標。此外, AWS Resilience Hub 可以識別下列區域內架構,以涵蓋應用程式、基礎設施和可用區域中斷:
-
區域備份
不同 AZ 中的僅供讀取複本
在另一個 AZ 中具有僅供讀取複本的 Aurora 叢集
Amazon Relational Database Service (Amazon RDS) 的異地同步備份執行個體
Amazon RDS 多可用區域叢集
在另一個 AZ 中具有僅供讀取複本的 Amazon RDS 單一執行個體
Amazon Simple Storage Service
本節列出 Amazon Simple Storage Service (Amazon S3) 特有的所有彈性檢查和建議。如需 Amazon S3 的詳細資訊,請參閱 Amazon S3 文件。
版本控制
AWS Resilience Hub 驗證 Amazon S3 儲存貯體是否已設定已啟用版本控制。
排程備份
AWS Resilience Hub 會檢查是否已為部署的 Amazon Simple Storage Service (Amazon S3) 儲存貯體定義 AWS Backup 計劃。此外,它也會檢查您的政策是否需要涵蓋區域層級中斷,是否已啟用跨區域備份選項。
時間點復原
AWS Resilience Hub 會檢查彈性政策的 RPO 目標是否需要point-in-time復原 (PITR)。不過,PITR 不支援跨區域備份。因此,您可以使用已啟用跨區域備份選項的現有排程 AWS Backup 計劃,或建立新的排程計劃。
資料複寫
AWS Resilience Hub 會檢查是否已為部署的 Amazon S3 儲存貯體定義相同的區域複寫 (SRR) 和跨區域複寫 (CRR)。Amazon S3 資料複寫可在應用程式、基礎設施、可用區域和區域層級改善預估工作負載 RTO 和預估工作負載 RPO。此外,它還可以保護物件免於實體刪除,因為刪除物件版本不會複寫到目標 Amazon S3 儲存貯體。此外,根據彈性政策中定義的 RTO 目標, 會 AWS Resilience Hub 檢查是否應啟用 Amazon S3 複寫時間控制 (S3 RTC)。此計費功能會在 15 分鐘內複寫 99.99% 的來源儲存貯體物件。
-
AWS Backup 具有自動備份選項的計劃
-
AWS Backup 如果您的政策要求,則使用跨區域備份複本進行規劃
-
第三方備份系統的手動快照
Amazon DynamoDB
本節列出 Amazon DynamoDB 特有的所有彈性檢查和建議。如需 Amazon DynamoDB 的詳細資訊,請參閱 Amazon DynamoDB 文件。
排程備份
AWS Resilience Hub 會檢查是否已為部署的資料表定義備份。此外,它也會檢查是否需要為您的政策設定跨區域備份,以涵蓋區域層級中斷。
時間點復原
AWS Resilience Hub 會根據彈性政策的 RPO 目標,檢查是否需要point-in-time復原 (PITR)。不過,PITR 不支援跨區域備份。因此,您可以使用已啟用跨區域備份選項的現有排程 AWS Backup 計劃,或建立新的排程計劃。
全域資料表
AWS Resilience Hub 會檢查部署的 Amazon DynamoDB 資料表是否定義為在其他區域中具有一或多個複本的全域資料表。設定全域資料表可改善區域層級的預估工作負載 RTO 和預估工作負載 RPO,也提供在主動主動主動或主動被動多區域模式中運作的功能。 AWS Backup 或 Amazon DynamoDB PITR 可用於其中一個區域來處理應用程式中斷。
Amazon Elastic Compute Cloud
本節列出 Amazon Elastic Compute Cloud 特有的所有彈性檢查和建議。如需 Amazon Elastic Compute Cloud 的詳細資訊,請參閱 Amazon Elastic Compute Cloud 文件。
狀態執行個體
AWS Resilience Hub 如果符合下列其中一項條件, 會將 Amazon EC2 執行個體識別為具狀態執行個體:
-
如果
DeleteOnTermination
至少有一個連接至此執行個體的 Amazon Elastic Block Store (Amazon EBS) 磁碟區屬性設定為 false。 -
如果 Amazon Data Lifecycle Manager 或 AWS Backup 計劃連接到 Amazon EC2 執行個體或至少一個 Amazon EBS 磁碟區。
-
如果 AWS Elastic Disaster Recovery 用於複寫 Amazon EC2 執行個體儲存磁碟區。
注意
如果 Amazon EC2 執行個體不符合上述任何條件, 會 AWS Resilience Hub 將其視為無狀態 Amazon EC2 執行個體。
Auto Scaling 群組
AWS Resilience Hub 會檢查無狀態 Amazon EC2 執行個體群組。如果發現,建議使用具有多可用區域組態的 Auto Scaling 群組 (ASG) 來協調相同的 。如果已識別現有的 ASG,ARH 將驗證是否已跨多個可用區域設定它。如果 ASG 也只使用 Spot Amazon EC2 執行個體定義,建議您使用隨需 Amazon EC2 執行個體增加其容量,以在 Spot Amazon EC2 執行個體無法使用時改善彈性。
Amazon EC2 機群
AWS Resilience Hub 可識別 Amazon EC2 機群,並驗證其是否定義為異地同步備份部署,以及是否僅使用 Spot Amazon EC2 執行個體。將 Amazon EC2 機群定義為異地同步備份部署,可改善異地同步備份中斷時的彈性。當 Spot 執行個體無法使用時,使用隨需執行個體增強 Amazon EC2 機群可改善其彈性。
Amazon EBS
本節列出 Amazon EBS 特有的所有彈性檢查和建議。如需 Amazon EBS 的詳細資訊,請參閱 Amazon EBS 文件。
排程備份
AWS Resilience Hub 會檢查是否已為您的 Amazon EBS 磁碟區定義下列其中一項或兩項。
-
連接至 Amazon EC2 執行個體之特定 Amazon EBS 磁碟區的備份規則。
-
將 Amazon EBS 後端 AMI 建立至 Amazon EC2 執行個體的備份規則。
-
第三方備份系統的手動快照。
此外,如果您的政策需要涵蓋區域層級中斷, 會 AWS Resilience Hub 檢查您的備份規則是否已啟用跨區域備份選項。
資料備份和複寫
AWS Resilience Hub 如果符合下列其中一項條件,則 Amazon EBS 磁碟區會被視為具狀態磁碟區:
-
如果此 Amazon EBS 磁碟區的
DeleteOnTermination
屬性設定為 false。 -
如果 Amazon Data Lifecycle Manager 或 AWS Backup 計劃與此 Amazon EBS 磁碟區或 Amazon EC2 執行個體相關聯,則會連接至該磁碟區或 Amazon EC2 執行個體。
-
如果 AWS Elastic Disaster Recovery 用於複寫 Amazon EC2 執行個體儲存磁碟區。
AWS Lambda
本節列出特定的所有彈性檢查和建議 AWS Lambda。如需詳細資訊 AWS Lambda,請參閱 AWS Lambda 文件。
客戶 Amazon VPC 存取
AWS Resilience Hub 識別連線至 VPC 的 AWS Lambda 函數。 AWS Lambda 連線至 Amazon VPC 不同AZs子網路,可在發生可用區域中斷時允許函數彈性。
無效字母佇列
AWS Resilience Hub 會檢查 AWS Lambda 函數是否連接無效字母佇列 (DLQ),以儲存失敗的請求。將 DLQ 連接至 AWS Lambda 函數可讓 防止請求的資料遺失,並重試在稍後階段處理失敗的請求。
Amazon Elastic Kubernetes Service
本節列出 Amazon Elastic Kubernetes Service (Amazon EKS) 特有的所有彈性檢查和建議。如需 Amazon EKS 的詳細資訊,請參閱 Amazon EKS 文件。
Multi-AZ deployment (異地同步備份部署)
AWS Resilience Hub 識別 Pod 部署是否在多個 AZs 中的多個工作者節點上執行。如果您的彈性政策在區域中斷時需要涵蓋範圍,則需要在另一個區域中使用額外的 Amazon EKS 叢集。此額外的 Amazon EKS 叢集也會針對分佈在多個 AZs 中多個工作者節點之間的 Pod 部署進行驗證。
部署與 ReplicaSet
AWS Resilience Hub 會檢查您是否使用 ReplicaSets 或 Pod 物件,而非部署。將 ReplicaSets 或 Pod 物件取代為部署,可簡化新版本軟體的 Pod 更新,並包含其他實用功能。
部署維護
AWS Resilience Hub 會檢查下列最佳實務是否用於部署:
-
使用 Pod 中斷預算 (PDB) – 使用 PDB 可透過設定工作負載中 Pod 數量的限制,在任何指定時間中斷,來改善可用性。
-
將自我管理節點群組取代為 Amazon EKS 受管節點群組 – 此取代可簡化維護期間的工作者節點映像更新。
-
支援每個部署的動態 CPU 和記憶體請求 – 這些請求可協助 Kubernetes 選擇符合 Pod 需求的節點。
-
為所有容器設定即時性和準備度探查 – 設定即時性探查有助於透過重新啟動非功能 Pod 來改善復原能力。設定準備程度探查可讓您將流量從忙碌的 Pod 中轉移來改善可用性。
-
設定 Karpenter、Cluster Autoscaler 或 AWS Fargate – 這些組態可讓 Amazon EKS 叢集的基礎設施成長並滿足工作負載需求。
-
設定水平 Pod Autoscaler – 此組態可協助 Amazon EKS 叢集自動擴展工作負載,以滿足請求處理需求。
Amazon Simple Notification Service
本節列出 Amazon Simple Notification Service (Amazon SNS) 特有的所有彈性檢查和建議。如需 Amazon SNS 的詳細資訊,請參閱 Amazon SNS 文件。
主題訂閱
AWS Resilience Hub 會檢查 Amazon SNS 主題是否至少連接 1 個訂閱,以確保傳入的訊息不會遺失。
Amazon Simple Queue Service
本節列出 Amazon Simple Queue Service (Amazon SQS) 特有的所有彈性檢查和建議。如需 Amazon SQS 的詳細資訊,請參閱 Amazon SQS 文件。
無效字母佇列
AWS Resilience Hub 會檢查 Amazon SQS 佇列是否有與其相關聯的 DLQ,以處理無法成功交付給訂閱用戶的訊息。
Amazon Elastic Container Service
本節列出 Amazon Elastic Container Service (Amazon ECS) 特有的所有彈性檢查和建議。如需 Amazon ECS 的詳細資訊,請參閱 Amazon ECS 文件。
Multi-AZ deployment (異地同步備份部署)
AWS Resilience Hub 根據 Amazon EC2 或啟動類型,檢查 Amazon ECS 任務或服務是否在多個 AZs 中執行。 AWS Fargate 如果您的政策需要區域中斷的涵蓋範圍,則需要在另一個區域中使用額外的 Amazon ECS 叢集。其他叢集也會經過驗證,以便在多個 AZs 中執行任務或服務。
Elastic Load Balancing
本節列出 Elastic Load Balancing 特有的所有彈性檢查和建議。如需 Elastic Load Balancing 的詳細資訊,請參閱 Elastic Load Balancing 文件。
Multi-AZ deployment (異地同步備份部署)
AWS Resilience Hub 會檢查 Elastic Load Balancing 是否在多個 AZs 中執行。
如果您的政策需要區域中斷的涵蓋範圍,則需要在不同的區域中使用額外的 Elastic Load Balancing。其他 Elastic Load Balancing 位於不同區域,也會針對其在多個 AZs 中的部署進行驗證。
Amazon API Gateway
本節列出 Amazon API Gateway 特有的所有彈性檢查和建議。如需 Amazon API Gateway 的詳細資訊,請參閱 Amazon API Gateway 文件。
跨區域部署
如果您的政策需要考慮區域中斷, AWS Resilience Hub 將檢查不同區域中是否有額外的 Amazon API Gateway API 資源部署。
私有 API 多可用區部署
AWS Resilience Hub 會檢查您的 API 是否在 Amazon API Gateway 中定義為私有。私有 APIs應透過部署到多個 AZs 的 Amazon VPC 介面端點接收流量。
Amazon DocumentDB
本節列出 Amazon DocumentDB 特有的所有檢查和建議。如需 Amazon DocumentDB 的詳細資訊,請參閱 Amazon DocumentDB 文件。
Multi-AZ deployment (異地同步備份部署)
AWS Resilience Hub 會檢查 Amazon DocumentDB 叢集是否部署在多個 AZs 中。如果您的政策需要涵蓋區域中斷,則不同區域需要額外的次要 Amazon DocumentDB 叢集。位於不同區域的 Amazon DocumentDB 叢集也會驗證其在多個 AZs 中的執行。
彈性叢集和多可用區域部署
AWS Resilience Hub 檢查 Amazon DocumentDB Elastic 叢集碎片是否使用部署在不同 AZs僅供讀取複本。
彈性叢集和手動快照
AWS Resilience Hub 會檢查是否定期為 Amazon DocumentDB Elastic 叢集建立手動快照。手動快照允許更長的持久性,並提供設定快照頻率的彈性,以滿足您的業務需求。
NAT 閘道
本節列出 NAT Gateway 特有的所有檢查和建議。如需 NAT Gateways 的詳細資訊,請參閱 NAT Gateways。
Multi-AZ deployment (異地同步備份部署)
AWS Resilience Hub 會檢查 NAT Gateway 是否部署在多個 AZs 中。如果您的政策需要涵蓋區域中斷,則不同區域需要額外的 NAT Gateway 部署。其他 NAT Gateway 位於不同區域,也會針對其在多個 AZs 中的部署進行驗證。
Amazon Route 53
本節列出 Amazon Route 53 特有的所有檢查和建議。如需 Amazon Route 53 的詳細資訊,請參閱 Amazon Route 53 文件。
Multi-AZ deployment (異地同步備份部署)
AWS Resilience Hub 會檢查 Amazon Route 53 託管區域記錄是否在相同區域中定義多個目標,以及這些目標是否部署在多個 AZs 中。如果您的政策需要區域中斷的涵蓋範圍, AWS Resilience Hub 會檢查 Amazon Route 53 託管區域記錄是否在多個區域中定義,每個區域具有多個目標,以及這些目標是否部署在多個 AZs 中。
Amazon Application Recovery Controller (ARC)
本節列出 Amazon Application Recovery Controller (ARC) (ARC) 特有的所有檢查和建議。如需 ARC 的詳細資訊,請參閱 ARC 文件。
Multi-AZ deployment (異地同步備份部署)
AWS Resilience Hub 會檢查類似資源是否部署在多個區域中,並建議作為最佳實務,以定義 ARC 整備檢查,以在區域中斷時提高其可用性和整備程度。您將會收到通知,告知您將產生額外的每小時費用。
Amazon FSx for Windows File Server
本節列出 Amazon FSx for Windows File Server 特有的所有檢查和建議。如需 Amazon FSx for Windows File Server 的詳細資訊,請參閱 Amazon FSx for Windows File Server 文件。
檔案系統類型
AWS Resilience Hub 會檢查檔案系統類型: Regional
或 One Zone
。檔案系統類型會影響其在基礎設施或可用區域中斷時的彈性。如需檔案系統類型的詳細資訊,請參閱 Amazon EFS。
檔案系統備份
AWS Resilience Hub AWS Backup 會檢查是否已為部署的檔案系統定義 。此外,它也會檢查您的政策是否需要涵蓋區域層級中斷,是否已啟用cross-Region backup
選項。
資料複寫
AWS Resilience Hub 會檢查是否已為部署的檔案系統定義區域內或跨區域排程 AWS DataSync 資料複寫任務。
AWS DataSync 排程資料複寫任務可以改善基礎設施、AZ 和區域層級的預估工作負載 RTO 和預估工作負載 RPO。此外,它可以與 區域內的 結合, AWS Backup 以便在應用程式中斷時復原。
AWS Step Functions
本節列出特定的所有檢查和建議 AWS Step Functions。如需詳細資訊 AWS Step Functions,請參閱 AWS Step Functions 文件。
版本控制和別名
AWS Resilience Hub 會檢查 AWS Step Functions 工作流程是否使用版本控制和別名來改善重新部署時間。
跨區域部署
AWS Resilience Hub 會檢查是否在不同區域中部署相同 AWS Step Functions 工作流程類型的工作流程,以便在區域中斷時復原。
Amazon ElastiCache (Redis OSS)
本節列出 Amazon ElastiCache (Redis OSS) 特有的所有檢查和建議。
如需 Amazon ElastiCache (Redis OSS) 的詳細資訊,請參閱 Amazon ElastiCache 文件。
單一可用區部署
AWS Resilience Hub 會檢查 Amazon ElastiCache (Redis OSS) 叢集是否部署為單一節點,或是否將其所有節點部署在單一可用區域中。
單一可用區部署
AWS Resilience Hub 驗證 Amazon ElastiCache (Redis OSS) 叢集是否部署為跨多個可用區域的複寫群組 (啟用叢集模式和停用叢集模式的叢集),以便在可用區域中斷時允許容錯移轉。
跨區域容錯移轉
AWS Resilience Hub 會檢查彈性政策中定義的 RTO 和 RPO 目標,以從區域中斷中復原。此外, AWS Resilience Hub 可以識別部署在多個區域中的 Amazon ElastiCache (Redis OSS) 全域資料存放區叢集。
備份
AWS Resilience Hub 會檢查下列備份功能是否套用至部署的 Amazon ElastiCache (Redis OSS) 或自行設計的叢集:
-
自動備份
-
第三方備份系統的手動備份
AWS Resilience Hub 如果您不使用備份, 不會建議備份做為復原方法。不過,您可以在資料不一致時重設快取層,並從主要儲存體重新建立資料。
更快速的區域內容錯移轉
AWS Resilience Hub 在基礎設施或 AZ 中斷期間, 會檢查彈性政策中定義的 RTO 和 RPO 目標。此外, AWS Resilience Hub 可以識別下列區域內架構,從基礎設施和可用區域中斷中復原:
-
叢集模式停用類型 Amazon ElastiCache (Redis OSS) 叢集的不同可用區域中的次要待命節點執行個體。
-
叢集模式啟用類型 Amazon ElastiCache (Redis OSS) 叢集的每個碎片中,位於不同可用區域的次要待命節點執行個體。