彈性的共同責任模型 - 可靠性支柱

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

彈性的共同責任模型

彈性是 AWS 和 之間的共同責任。您了解在此共用模型之下,做為彈性一部分的災難復原 (DR) 和可用性如何操作相當重要。

AWS 責任 - 雲端的彈性

AWS 負責執行 中提供之所有服務的基礎設施的彈性 AWS 雲端。此基礎設施包含執行 AWS 雲端 services 的硬體、軟體、聯網和設施。 AWS 會盡商業上合理的努力來提供 AWS 雲端 這些服務,確保服務可用性符合或超過AWS 服務層級協議 (SLAs)

AWS 全球雲端基礎設施旨在可讓客戶建置高彈性的工作負載架構。每個 AWS 區域 都是完全隔離的,由多個可用區域 組成,這些可用區域是基礎設施的實體隔離分割區。可用區域會隔離可能影響工作負載彈性的故障,防止這些故障影響區域中的其他區域。但同時, 中的所有區域 AWS 區域 都會與高頻寬、低延遲網路互連,透過完全冗餘的專用都會光纖,在區域之間提供高輸送量、低延遲的網路。區域之間的所有流量都會加密。網路效能足以完成區域之間的同步複寫。當應用程式跨 分割時AZs,公司會受到更好的隔離和保護,免於發生停電、雷擊、龍捲風、颶風等問題。

客戶責任 - 雲端中的彈性

您的責任取決於您選擇的 AWS 雲端 服務。這決定您在履行彈性責任過程中必須執行的設定工作量。例如,Amazon Elastic Compute Cloud (Amazon EC2) 之類的服務會要求客戶執行所有必要的恢復能力組態和管理任務。部署 Amazon EC2執行個體的客戶負責跨多個位置部署 Amazon EC2執行個體 (例如 AWS 可用區域)、使用 Auto Scaling 等服務實作自我修復,以及針對安裝在執行個體上的應用程式使用彈性工作負載架構最佳實務。對於 Amazon S3 和 Amazon DynamoDB 等受管服務, AWS 操作基礎設施層、作業系統和平台,以及客戶存取端點以存放和擷取資料。您負責管理您的資料的彈性,包括備份、版本控制和複寫策略。

在 中跨多個可用區域部署工作負載, AWS 區域 是高可用性策略的一部分,旨在透過將問題隔離到一個可用區域來保護工作負載,該區域使用其他可用區域的備援來繼續服務請求。多可用區域架構也是 DR 策略的一部分,其設計目的是讓工作負載更好地隔離,並且防範例如停電、雷擊、龍捲風、地震等問題。DR 策略也會使用多個 AWS 區域。例如,在主動/被動組態中,如果主動區域再也無法為請求提供服務,則工作負載的服務會從其主動區域容錯移轉到其 DR 區域。

圖表說明共用彈性模型。

客戶和 AWS對於雲端中彈性的責任。

您可以使用 AWS 服務來實現復原能力目標。身為客戶,您負責管理系統的下列層面,達成雲端中的彈性。如需具體各個服務的詳細資訊,請參閱 AWS 文件

聯網、配額和限制

  • 此區域的共同責任模式最佳實務在基礎底下詳細說明。

  • 根據適用情況下的預期負載請求增加,使用足夠的空間規劃您的架構,以便擴展和了解您所包含服務的服務配額和限制。

  • 將您的網路拓撲設計成高度可用、備援和可擴展。

變更管理和營運彈性

  • 變更管理包括如何在您的環境中引入和管理變更。實作變更需要建置執行手冊並且保持最新狀態,以及您的應用程式和基礎設施的部署策略。

  • 監控工作負載資源的彈性策略會考慮所有元件,包括技術和商業指標、通知、自動化和分析。

  • 雲端中的工作負載必須適應需求變更擴展,以因應損害或用量波動。

可觀測性和失敗管理

工作負載架構

  • 您的工作負載架構包括如何設計業務網域相關的服務、套用SOA和分散式系統設計以防止故障,以及建置限流、重試、佇列管理、逾時和緊急槓桿等功能。

  • 仰賴經實證的 AWS 解決方案Amazon 建置者資料中心無伺服器模式可以與最佳實務保持一致,並且立即開始實作。

  • 使用持續改善將您的系統分解成分散式服務,更快擴展和創新。使用 AWS 微型服務指引和受管服務選項,簡化及加速您引入變更和創新的能力。

持續測試關鍵基礎設施

  • 測試可靠性是指測試功能、效能和混沌層級,以及採用事件分析和演練日實務來建置專業知識,解決尚未充分了解的問題。

  • 對於全面雲端和混合應用程式,了解發生問題或元件停機時的應用程式行為方式,可讓您快速且可靠地從中斷復原。

  • 建立和記載可重複的試驗,了解事情未如預期般運作時,您的系統的行為方式。這些測試會證明您的整體彈性的有效性,並且在您的操作程序面臨實際失敗情境時,提供意見回饋循環。