雲端原生工作負載的 DR - AWS 規範指南

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

雲端原生工作負載的 DR

考慮您的雲端原生工作負載如何符合 DR 目標。 AWS 在全球各地的區域提供多個可用區域。許多使用 AWS 雲端的企業會調整其工作負載架構和災難復原目標,以承受可用區域的損失。 AWS Well-Architected 的框架中的可靠性支柱支持這種最佳實踐。您可以架構工作負載及其服務和應用程式相依性,以使用多個可用區域。然後,您可以將 DR 自動化並實現災難復原目標,而且只需最少甚至不需要干預。

但實際上,您可能會發現無法為所有元件建立冗餘、使用中和自動化的架構。檢查架構的每一層,以判斷達成目標所需的災難復原程序。這可能因工作負載而異,具有不同的架構和服務需求。本指南涵蓋 Amazon EC2 的考量事項和選項。對於其他 AWS 服務,您可以參閱AWS 文件以判斷高可用性和 DR 選項。

適用於單一可用區域中的 Amazon EC2 DR

嘗試架構您的工作負載,以主動支援和服務來自多個可用區域的用戶端。您可以使用 Amazon EC2 Auto Scaling 和 Elastic Load Balancing 來實現適用於 Amazon EC2 和其他服務的異地同步備份伺服器架構。

如果您的架構具有無法進行負載平衡的 EC2 執行個體,且在任何特定時刻只能執行單一執行個體,則可以使用下列任一選項。

  • 建立 Auto Scaling 群組,其大小下限、最大和所需大小為 1,並針對多個可用區域進行設定。創建一個 AMI,如果實例失敗,可用於替換實例。請務必定義適當的自動化和設定,以便 AMI 新佈建的執行個體可以自動設定並提供服務。建立指向 Auto Scaling 群組並針對多個可用區域設定的負載平衡器。您也可以選擇建立指向負載平衡器端點的 Amazon Route 53 別名。

  • 為您的作用中執行個體建立 Route 53 記錄,並讓用戶端使用此記錄連線。建立指令碼以建立作用中執行個體的新 AMI,並使用 AMI 在單獨的可用區域中佈建處於停止狀態的新 EC2 執行個體。設定指令碼定期執行,並終止先前停止的執行個體。如果可用區域發生故障,請在替代可用區域中啟動備份執行個體。然後更新 Route 53 記錄以指向此新執行個體。

模擬解決方案設計用來防範的故障,徹底測試您的解決方案。此外,也請考慮您的 DR 解決方案在工作負載架構變更時所需的更新。

區域故障中 Amazon EC2 的 DR

具有高可用性需求的客戶 (例如,無法容忍任何停機時間的關鍵任務應用程式) 可 AWS 跨多個區域使用,以針對區域層級的問題提供進一步的彈性。客戶必須仔細權衡建立和維護多區域災難復原計劃所需的複雜性、成本和精力,以及效益。 AWS 提供支援全球可用性、容錯移轉和 DR 的多區域架構的功能本指南涵蓋 Amazon EC2 備份和復原專用的一些可用功能。

AWS AMI 和 Amazon EBS 快照是區域資源,可用於在單一區域內佈建新執行個體。但是,您可以將快照和 AMI 複製到另一個區域,並使用它們在該區域中佈建新的執行個體。若要支援區域故障災難復原計劃,您可以將 AMI 和快照複製到其他區域的程序自動化。 AWS Backup Amazon 資料生命週期管理員支援跨區域複製作為備份組態的一部分。

AWS Elastic Disaster Recovery可用於自動化並持續將一個區域中的 Amazon EC2 伺服器複寫到另一個 DR 區域。彈性災難復原可簡化您的多區域災難復原方法,並協助您使用演習定期測試跨區域 Amazon EC2 DR 計劃。當備份和復原無法達到 RTO 和 RPO 目標時,彈性災難復原可以提供協助。彈性災難復原可以幫助您將 RTO 降低到幾分鐘,並將 RPO 降低到低於一秒的範圍。

無論您使用哪種解決方案,都必須判斷發生中斷時要使用的佈建、容錯移轉和容錯回復程序。您可以使用 Route 53 搭配運作狀態檢查和網域名稱系統容錯移轉,以協助支援您的解決方