彈性的共同責任模型 - 可靠性支柱

彈性的共同責任模型

彈性是 AWS 與您之間的共同責任。您了解在此共用模型之下,做為彈性一部分的災難復原 (DR) 和可用性如何操作相當重要。

AWS 責任 - 雲端的彈性

AWS 會負責基礎設施的彈性,以執行 AWS 雲端提供的所有服務。此基礎設施包含硬體、軟體、網路和執行 AWS 雲端服務的設施。AWS 會使用商業上合理的工作量讓這些 AWS 雲端 服務可供使用,確保服務可用性符合或超過 AWS 服務水準協議 (SLA)

AWS 全球雲端基礎設施的設計目的是讓客戶可以建置具有高度彈性的工作負載架構。每個 AWS 區域都完全隔離並且包含多個可用區域,是基礎設施的實體隔離分割區。可用區域會隔離可能影響工作負載彈性的故障,防止這些故障影響區域中的其他區域。但是於此同時 AWS 區域中的所有區域都是使用完全備援的專用都會光纖 (在區域之間提供高輸送量、低延遲網路),搭配高頻寬、低延遲網路來互連。區域之間的所有流量都會加密。網路效能足以完成區域之間的同步複寫。應用程式跨 AZ 分割時,公司可以獲得更好的隔離和保護,讓您免於停電、雷擊、龍捲風、颶風等問題。

客戶責任 - 雲端中的彈性

您的責任是由您選取的 AWS 雲端服務來決定的。這決定您在履行彈性責任過程中必須執行的設定工作量。例如,Amazon Elastic Compute Cloud (Amazon EC2) 之類的服務需要客戶執行所有必要的彈性組態和管理任務。部署 Amazon EC2 執行個體的客戶要負責在多個位置部署 Amazon EC2 執行個體 (例如 AWS 可用區域)、實作自我修復,使用例如 Auto Scaling 的服務,並且針對安裝在執行個體上的應用程式使用彈性工作負載架構最佳實務。對於 Amazon S3 和 Amazon DynamoDB 等受管服務,AWS 會操作基礎設施層、操作系統和平台,而且客戶會存取端點以存放和擷取資料。您負責管理您的資料的彈性,包括備份、版本控制和複寫策略。

在 AWS 區域中的多個可用區域之間部署您的工作負載,是高可用性策略的一部分,該策略的設計目的是藉由將問題隔離到其中一個可用區域來保護工作負載,使用其他可用區域的備援持續為請求提供服務。多可用區域架構也是 DR 策略的一部分,其設計目的是讓工作負載更好地隔離,並且防範例如停電、雷擊、龍捲風、地震等問題。DR 策略也會使用多個 AWS 區域。例如,在主動/被動組態中,如果主動區域再也無法為請求提供服務,則工作負載的服務會從其主動區域容錯移轉到其 DR 區域。


        圖表說明共用彈性模型。

客戶和 AWS 對於雲端中彈性的責任。

您可以使用 AWS 服務來達成您的彈性目標。身為客戶,您負責管理系統的下列層面,達成雲端中的彈性。如需特定各個服務的詳細資訊,請參閱 AWS 文件

網路、配額和限制

  • 此區域的共同責任模型最佳實務在基礎底下詳細說明。

  • 根據適用情況下的預期負載請求增加,使用足夠的空間規劃您的架構,以便擴展和了解您所包含服務的服務配額和限制。

  • 將您的網路拓撲設計成高度可用、備援和可擴展。

變更管理和營運彈性

  • 變更管理包括如何在您的環境中引入和管理變更。實作變更需要建置執行手冊並且保持最新狀態,以及您的應用程式和基礎設施的部署策略。

  • 監控工作負載資源的彈性策略會考慮所有元件,包括技術和商業指標、通知、自動化和分析。

  • 雲端中的工作負載必須適應需求變更擴展,以因應損害或用量波動。

可觀測性和失敗管理

工作負載架構

  • 您的工作負載架構包括您如何設計商業網域的服務、套用 SOA 和分散式系統設計來防止失敗,以及建置限流、重試、佇列管理、逾時和緊急控制桿之類的功能。

  • 仰賴經實證的 AWS 解決方案Amazon 建置者資料中心無伺服器模式可以與最佳實務保持一致,並且立即開始實作。

  • 使用持續改善將您的系統分解成分散式服務,更快擴展和創新。使用 AWS 微型服務指引和受管服務選項,簡化及加速您引入變更和創新的能力。

持續測試關鍵基礎設施

  • 測試可靠性是指測試功能、效能和混沌層級,以及採用事件分析和演練日實務來建置專業知識,解決尚未充分了解的問題。

  • 對於全面雲端和混合應用程式,了解發生問題或元件停機時的應用程式行為方式,可讓您快速且可靠地從中斷復原。

  • 建立和記載可重複的試驗,了解事情未如預期般運作時,您的系統的行為方式。這些測試會證明您的整體彈性的有效性,並且在您的操作程序面臨實際失敗情境時,提供意見回饋循環。