REL11-BP02 容錯移轉至運作良好的資源
可確保如果發生資源故障,運作良好的資源可以繼續為請求提供服務。對於位置故障 (例如可用區域或 AWS 區域),請確保您的系統已就位,可容錯移轉至未受影響位置中運作良好的資源。
AWS 服務 (例如 Elastic Load Balancing 和 AWS Auto Scaling) 會協助跨資源和可用區域分配負載。因此,可以透過將流量轉移到剩餘運作狀態良好的資源來緩解個別資源 (例如 EC2 執行個體) 的失敗或可用區域的損害。對於多區域工作負載,這會更複雜。例如,跨區域僅供讀取複本讓您可以將資料部署至多個 AWS 區域,但您仍須將僅供讀取複本升階為主節點,並在發生容錯移轉時將流量指向其中。Amazon Route 53 和 AWS Global Accelerator 可以協助跨 AWS 區域 路由流量。
如果您的工作負載使用 Amazon S3 或 Amazon DynamoDB 等 AWS 服務,則它們會自動部署至多個可用區域。如果發生失敗,AWS 控制平面會自動為您路由流量至運作良好的位置。資料以冗餘方式存放在多個可用區域中,並且仍然可用。對於 Amazon RDS,您必須選擇異地同步備份做為組態選項,然後在發生失敗時,AWS 會自動將流量導向至運作良好的執行個體。對於 Amazon EC2 執行個體、Amazon ECS 任務或 Amazon EKS Pod,您可以選擇要部署的可用區域。然後,Elastic Load Balancing 會提供解決方案,以偵測運作狀態不佳區域中的執行個體,並將流量路由至運作良好的區域。Elastic Load Balancing 甚至可將流量路由至內部部署資料中心內的元件。
對於多區域方法 (可能也包含內部部署資料中心),Amazon Route 53 提供一種定義網際網路網域的方法,並指派包含運作狀態檢查的路由政策,以確保流量路由至運作良好的區域。或者,AWS Global Accelerator 提供靜態 IP 地址,做為應用程式的固定進入點,然後使用 AWS 全球網路 (而不是網際網路) 路由至您所選 AWS 區域中的端點,以獲得更好的效能和可靠性。
AWS 在設計服務時會考慮到故障復原。我們設計服務以最大程度地減少從故障復原的時間以及對資料的影響。我們的服務主要使用僅在將請求持久儲存於區域內的多個複本中之後才確認請求的資料存放區。這些資源和服務包括 Amazon Aurora、Amazon Relational Database Service (Amazon RDS) 異地同步備份資料庫執行個體、Amazon S3、Amazon DynamoDB、Amazon Simple Queue Service (Amazon SQS) 和 Amazon Elastic File System (Amazon EFS)。它們經建構為使用基於儲存格的隔離以及可用區域提供的故障隔離。我們在營運程序中廣泛使用自動化。我們還對我們的取代-重啟功能進行優化,以期從中斷中快速復原。
若未建立此最佳實務,暴露的風險等級: 高
實作指引
-
容錯移轉至運作良好的資源。可確保如果發生資源故障,運作良好的資源可以繼續為請求提供服務。對於位置故障 (例如可用區域或 AWS 區域),請確保您的系統已就位,可容錯移轉至未受影響位置中運作良好的資源。
-
如果您的工作負載使用 Amazon S3 或 Amazon DynamoDB 等 AWS 服務,則它們會自動部署至多個可用區域。如果發生失敗,AWS 控制平面會自動為您路由流量至運作良好的位置。
-
對於 Amazon RDS,您必須選擇異地同步備份做為組態選項,然後在發生失敗時,AWS 會自動將流量導向至運作良好的執行個體。
-
對於 Amazon EC2 執行個體或 Amazon ECS 任務,您可以選擇要部署的可用區域。然後,Elastic Load Balancing 會提供解決方案,以偵測運作狀態不佳區域中的執行個體,並將流量路由至運作良好的區域。Elastic Load Balancing 甚至可將流量路由至內部部署資料中心內的元件。
-
如果採用多區域方法 (可能也包含內部部署資料中心),確保來自運作狀態良好之位置的資料和資源可以繼續為請求提供服務
-
例如,跨區域僅供讀取複本讓您可以將資料部署至多個 AWS 區域,但您仍須將僅供讀取複本升階為主節點,並在主要位置發生失敗時將流量指向該主節點。
-
Amazon Route 53 提供一種方法,可定義網際網路網域和指派路由政策 (可能包含運作狀態檢查),以確保流量路由到運作狀態良好的區域。或者,AWSGlobal Accelerator 提供靜態 IP 地址,做為應用程式的固定進入點,然後使用 AWS 全球網路 (而不是公用網際網路) 路由至您所選 AWS 區域中的端點,以獲得更好的效能和可靠性。
-
-
資源
相關文件:
相關範例: