高可用性不是災難復原 - AWS 上的工作負載災難復原:雲端中的復原

高可用性不是災難復原

可用性和災難復原仰賴一些相同的最佳實務,例如監控故障、部署到多個位置以及自動容錯移轉。但是,可用性側重於工作負載的元件,而災難復原則側重於整個工作負載的獨立副本。災難復原的目標與可用性不同,其目標為衡量符合災難條件之大規模事件後的恢復時間。您應先確保工作負載能符合您的可用性目標,因為高可用性架構可在發生影響可用性的事件時,讓您滿足客戶的需求。災難復原策略需要的方法與可用性不同,重點是將離散系統部署到多個位置,以便在必要時可以容錯移轉整個工作負載。

您必須在災難復原規劃中考慮工作負載的可用性,因為它會影響您採用的方法。在一個可用區域中的單一 Amazon EC2 執行個體上執行的工作負載,不具備有高可用性。如果本地洪水問題影響該可用區域,則此方案需要容錯移轉到另一個可用區域以滿足 DR 目標。將此方案與部署多站點主動/主動的高可用性工作負載進行比較,其中工作負載跨多個活動區域部署,所有區域都為生產流量提供服務。在這種情況下,即使是發生摧毀整個區域的極罕見大規模災難,DR 策略也是透過將所有流量路由到其餘區域來完成的。

在可用性和災難復原之間,處理資料的方式也有所不同。假設有一個儲存解決方案,會持續複寫到另一個站點以實現高可用性 (例如多站點、主動/主動工作負載)。如果主要儲存裝置上的一或多個檔案遭到刪除或毀損,那麼這些破壞性變更也會複製到次要儲存裝置。在此情境下,雖然具備高可用性,但由於資料遭到刪除或毀損,進行容錯移轉的能力因此受到損害。反之,DR 策略中也需具備時間點備份。