災難復原案例 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

災難復原案例

本節提供單一可用區域或 AWS 區域故障的範例,並討論災難復原 (DR) 的選項。這些範例假設復原點目標 (RPO) 為 15 分鐘,復原時間目標 (RTO) 為 4 小時。

可用區域故障

您可以使用下列其中一個選項,從指定參數 (RPO 為 15 分鐘,RTO 為 4 小時) 內的單一可用區域故障中復原。

  • 使用最新的 Amazon Elastic Compute Cloud (Amazon EC2) 映像備份來佈建應用程式復原,並透過 Always On 可用性群組部署或日誌運送來連線至現有的暖待命資料庫執行個體。

  • 如果您有應用程式,例如具有向外擴展部署的 SQL Server Reporting Services (SSRS) 應用程式,負載平衡器可以將所有流量重新導向至次要節點。

  • 您可以使用應用程式和資料庫伺服器的 Amazon EC2 基礎 AMIs 來佈建基礎設施。視資料庫的大小和備份頻率而定,可以在新的可用區域中還原資料庫,從最新的原生備份 (每 5 分鐘完整備份、差異備份或交易日誌備份) 或使用 EBS 快照。此選項符合 RPO 和 RTO 要求,但需要自訂指令碼。您還必須考慮佈建基礎設施所需的時間,而滿足 RPO 和 RTO 要求可能具有挑戰性。

  • 應用程式和資料庫伺服器的 Amazon EC2 映像 (包括 EBS 磁碟區) 都可以在新的可用區域中還原。RPO 可能具有挑戰性,取決於最近的備份,但此選項可與最新的交易日誌結合以滿足需求。此選項支援 Windows 磁碟區陰影複製服務 (VSS) 快照。

區域失敗

您可以使用下列其中一個選項,從指定參數 (RPO 為 15 分鐘,RTO 為 4 小時) 內的單一 AWS 區域失敗中復原。

  • 您可以針對應用程式和資料庫伺服器使用 Amazon EC2 基礎 Amazon Machine Image AMIs) 來佈建基礎設施。視資料庫的大小和備份頻率而定,可以在新區域中從最新的原生備份 (每 5 分鐘完整備份、差異備份或交易日誌備份) 還原資料庫。此選項符合 RPO 和 RTO 要求,但需要自訂指令碼。

    • 將 SQL Server 日誌運送為 DR 解決方案需要手動容錯移轉至待命伺服器,並取決於日誌備份的頻率。這是最便宜的 DR 選項之一。主要和日誌運送 DR 網站的 SQL Server 版本不需要相符。此選項符合 RPO (每 5 分鐘使用交易日誌備份) 和 RTO,但需要透過手動自訂指令碼進行維護。大型資料庫需要較長的還原時間。

  • 您可以為應用程式和資料庫伺服器使用 Amazon EC2 AMI,並將其還原至新區域中的目標。RPO 取決於備份的大小和頻率。

    • 您可以使用 AMI 還原最新的應用程式映像。您可以使用最近的原生差異或交易日誌備份,每 5 分鐘更新資料庫以符合 RPO。

    • 如果來源尚未與目標同步,RTO 取決於將快照傳輸和還原至新區域的大小和時間。

  • 停機時間最短的解決方案是還原應用程式備份映像,並使用雙節點、三節點或四節點可用性群組設定 (基本、傳統或分散式) 在遠端區域擁有暖備援 SQL Server 節點,並在容錯移轉後連線至待命資料庫伺服器。同步遞交模式複本符合 RPO 要求,而非同步遞交模式複本可能會根據交易量而延遲。如有需要,您可以使用分散式可用性群組組態來擴展新區域中的資料庫節點。此組態也會降低複雜性,因為它使用兩個獨立可用性群組,而不是以同步遞交或非同步遞交模式跨區域分佈的單一可用性群組,並舒適地滿足 RTO 和 RPO 要求。或者,在 Standard Edition 中使用 SQL Server 基本可用性群組也是一個選項。不過,它有限制,因為它最多只支援兩個節點,而且雖然支援多個可用群組,但單一可用群組中只能有一個資料庫。您可以在一個區域中或跨區域設定 SQL Server Standard 版本。此版本可節省成本,因為它不會針對次要節點收費,讀取操作無法存取該節點。SQL Server Enterprise Edition 提供完整功能,並支援將所有資料庫的容錯移轉做為單一可用性群組容錯移轉。

常用案例

在規模調整練習中,在 Amazon EC2 上執行且具有正常線上交易處理 (OLTP) 工作負載的 SQL Server 應用程式中,有 80% 可以根據其重要性來分組為三個類別之一:

  • SQL Server HA/DR 搭配 SQL Server 備份,使用兩個同步遞交複本和一個非同步遞交模式複本

  • AWS Backup 具有 SQL Server 備份的 HA/DR,使用應用程式和資料庫的 Amazon EC2 AMI,以及 Amazon EBS 儲存體

  • AWS Backup HA/DR 搭配 SQL Server 備份、使用資料庫伺服器的 Amazon EC2 基礎 AMI、應用程式的 Amazon EC2 映像,以及 Amazon EBS 快照

下表提供有關每個類別的詳細資訊。

  具有 SQL Server 備份的 SQL Server HA/ DR AWS Backup 具有 AMIs、EBS 儲存和 SQL Server 備份的 HA/DR AWS Backup 具有 AMIs、EBS 快照和 SQL Server 備份的 HA/DR

發生災難時的還原程序

  • 從 還原應用程式的 Amazon EC2 基礎 AMI AWS Backup

  • 容錯移轉至 區域中的待命執行個體 (在可用區域故障的情況下) 或跨區域執行個體 (在區域故障時)

  • 符合 RPO 和 RTO 要求

  • 從應用程式和資料庫的備份還原 Amazon EC2 映像

  • 同時提供區域內和跨區域支援

  • 套用最新的 SQL Server 差異和交易日誌備份 (每 15 分鐘),以符合資料庫的 RPO 和 RTO 需求

  • 從應用程式的備份還原 Amazon EC2 映像

  • 還原資料庫伺服器的 Amazon EC2 基礎 AMI

  • 還原 EBS 快照 (如果有的話)

  • 叢集必須重建

  • 同時提供區域內和跨區域支援

  • 將最新的差異和交易日誌備份套用至資料庫,以符合 RPO 要求,但可能不符合 RTO

主要資源

  • 三個 SQL Server Enterprise Edition 授權 (如果您與 Microsoft 有現有的軟體保證授權合約,則無條件取得被動 HA 和 DR 節點授權;請參閱公告)

  • Amazon Simple Storage Service (Amazon S3) 上的 Amazon EC2 備份空間Amazon S3

  • 跨區域資料傳輸

  • 一個 SQL Server 授權 (任何版本)。

  • Amazon S3 上的 Amazon EC2 備份空間 Amazon S3

  • Amazon S3 上的 SQL Server 備份 (差異和日誌檔案)

  • 跨區域資料傳輸

  • 一個 SQL Server 授權 (任何版本)。

  • Amazon S3 上的 Amazon EC2 備份空間 Amazon S3

  • Amazon S3 上的 SQL Server 備份 (差異和日誌檔案)

  • 跨區域資料傳輸

HA/DR

提供 HA 和 DR

僅提供 DR

僅提供 DR

RPO

容錯移轉由 SQL Server 可用性群組處理 (DR 為手動)

手動或自訂指令碼

手動或自訂指令碼

RTO

秒到分鐘

分鐘到小時

多個小時

缺少 SLAs 的風險

可管理性

簡便

擴展

簡便

上傳至 Amazon S3 或跨區域傳輸的檔案大小限制

N/A – 以同步遞交模式或非同步遞交模式處理至暖待命

資料遺失

接近零 (取決於佈建的工作負載和基礎設施)

取決於 Amazon EC2 備份映像和 SQL Server 備份的頻率

取決於 Amazon EC2 備份映像或 EBS 快照和 SQL Server 備份的頻率

成本

低 – 中

低 – 中