REL13-BP05 自動化復原 - 可靠性支柱

REL13-BP05 自動化復原

使用 AWS 或第三方工具自動化系統復原,並將流量路由到 DR 站點或區域。

根據設定的運作狀態檢查,Elastic Load Balancing 和 AWS Auto Scaling 等 AWS 服務可將負載分散到運作狀態良好的可用區域,而 Amazon Route 5、AWS 和 Global Accelerator 等服務則可將負載路由到運作狀態良好的 AWS 區域。Amazon Route 53 應用程式復原控制器可協助您使用準備度檢查和路由控制功能,來管理和協調容錯移轉。這些功能會持續監控應用程式從失敗中復原的功能,以便您跨多個 AWS 區域、可用區域和內部部署來控制應用程式復原。

對於現有實體或虛擬資料中心或私有雲端上的工作負載, AWS 彈性災難復原(可透過 AWS Marketplace 取得) 可讓組織設定 AWS 的自動化災難復原策略。CloudEndure 也支援 AWS 中的跨區域/跨可用區域災難復原。

常用的反模式:

  • 實作相同的自動化容錯移轉和容錯回復會在失敗發生時導致翻動。

建立此最佳實務的優勢: 自動化復原可以消除手動錯誤的機會,減少您的復原時間。

若未建立此最佳實務,暴露的風險等級為:

實作指引

  • 自動化復原路徑。若復原時間較短,則人為判斷和行動無法用於可用性高的方案。系統應在每種情況下都能自動復原。

    • 使用 CloudEndure Disaster Recovery 進行自動化容錯移轉和容錯回復:CloudEndure Disaster Recovery 會持續將您的機器 (包括作業系統、系統狀態組態、資料庫、應用程式和檔案) 複寫至您的目標 AWS 帳戶和慣用區域中的低成本階段區域。發生災難時,您可以指示 CloudEndure Disaster Recovery 在數分鐘內自動啟動處於完全佈建狀態的數千部機器。

資源

相關文件:

相關影片: