REL09-BP01 識別並備份所有需要備份的資料,或從來源複製資料 - 可靠性支柱

REL09-BP01 識別並備份所有需要備份的資料,或從來源複製資料

了解和使用工作負載所使用的資料服務和資源的備份功能。大部分服務都會提供備份工作負載資料的功能。

預期成果:已根據重要性識別並分類資料來源。然後,根據 RPO 建立資料復原的策略。此策略涉及備份這些資料來源,或具有從其他來源重現資料的能力。若遺失資料,實作的策略可讓您在定義的 RPO 和 RTO 內復原或重現資料。

雲端成熟度階段:基礎

常見的反模式:

  • 未注意工作負載的所有資料來源及其關鍵性。

  • 未備份關鍵資料來源。

  • 只備份某些資料來源,而未使用關鍵性做為準則。

  • 沒有已定義的 RPO,或備份頻率無法符合 RPO。

  • 未評估是否需要備份,或是否可從其他來源重現資料。

建立此最佳實務的優勢:確定需要備份的位置並實作建立備份的機制,或是能夠從外部來源重製資料,這可提升在中斷時還原及復原資料的能力。

未建立此最佳實務時的曝險等級:

實作指引

所有 AWS 資料存放區都會提供備份功能。Amazon RDS 和 Amazon DynamoDB 等服務會額外地支援啟用時間點復原 (PITR) 的自動備份,這可讓您將備份還原到目前時間之前最多五分鐘或更短的任何時間。許多 AWS 服務都提供將備份複製到另一個 AWS 區域的功能。AWS Backup 是一種工具,可讓您跨 AWS 服務集中化和自動化資料保護。AWS Elastic Disaster Recovery 可讓您複製完整的伺服器工作負載,並維護內部部署、跨可用區域或跨區域的持續資料保護,並以秒為單位測量復原點目標 (RPO)。

Amazon S3 可以用作自行管理和 AWS 管理的資料來源的備份目的地。Amazon EBS、Amazon RDS 和 Amazon DynamoDB 等 AWS 服務具有建立備份的內建功能。也可以使用第三方備份軟體。

可使用 AWS Storage GatewayAWS DataSync,將內部部署資料備份至 AWS 雲端。Amazon S3 儲存貯體可用來在 AWS 中存放此資料。Amazon S3 提供多種儲存層級,例如 Amazon S3 Glacier 或 S3 Glacier Deep Archive,以降低資料儲存成本。

您能夠從其他資源重現資料來符合資料復原需求。例如,如果主節點遺失,您可以使用 Amazon ElastiCache 複本節點Amazon RDS 讀取複本來重現資料。如果這類來源可以用於滿足您的復原點目標 (RPO) 和復原時間點目標 (RTO),則可能不需要備份。另一個範例是,如果使用 Amazon EMR,則可能不需要備份 HDFS 資料存放區,只要您可以從 Amazon S3 將資料複製到 Amazon EMR 即可。

選取備份策略時,請考慮復原資料所需的時間。復原資料所需的時間取決於備份的類型 (若有備份策略),或資料重現機制的複雜性。此時間應該落在工作負載的 RTO 內。

實作步驟

  1. 識別工作負載的所有資料來源。資料可以存儲在許多資源上,例如資料庫磁碟區檔案系統日誌記錄系統物件儲存。請參閱資源部分,尋找儲存資料之不同 AWS 服務的相關文件,以及這些服務提供的備份功能。

  2. 根據重要性對資料來源進行分類。不同的資料集對工作負載具有不同的關鍵性等級,因此對彈性具有不同的要求。例如,有些資料可能至關重要,且需要接近零的 RPO,而其他資料可能不太重要,且可以容忍更高的 RPO 和一些資料遺失。同樣地,不同的資料集也可能具有不同的 RTO 要求。

  3. 使用 AWS 或第三方服務來建立資料的備份AWS Backup 是一項託管服務,它允許在 AWS 上建立各種資料來源的備份。AWS Elastic Disaster Recovery 可處理 AWS 區域 的自動次秒級資料複寫。大部分 AWS 服務也具有建立備份的原生功能。AWS Marketplace 具有許多也提供這些功能的解決方案。有關如何從各種 AWS 服務建立資料備份的資訊,請參閱下面列出的資源

  4. 對於未備份的資料,請建立資料複製機制。您可能基於各種原因選擇不備份可從其他來源重現的資料。可能有一種情況,即在需要時從來源重現資料比建立備份更便宜,因為可能有與儲存備份相關聯的成本。另一個範例是從備份中還原比從來源重現資料需要更長的時間,因而導致 RTO 中出現缺口。在這類情況下,考慮取捨並建立一個妥善定義的流程,其中指出在需要資料復原時如何從這些來源重現資料。例如,如果您已將資料從 Amazon S3 載入資料倉儲 (如 Amazon Redshift) 或 MapReduce 叢集 (如 Amazon EMR) 來分析該資料,這可以成為從其他來源複製的資料之範例。只要這些分析的結果存放在某處或可複製,您就不會因為資料倉儲或 MapReduce 叢集故障而遺失資料。其他可從來源複製的範例包括快取 (如 Amazon ElastiCache) 或 RDS 的僅供讀取複本。

  5. 建立備份資料的節奏。建立資料來源的備份是一種定期流程,而且頻率應取決於 RPO。

實作計畫的工作量:

資源

相關的最佳實務:

REL13-BP01 定義停機和資料遺失的復原目標

REL13-BP02 使用定義的復原策略來滿足復原目標

相關文件:

相關影片:

相關範例: