可用性和超越:了解和提高分佈式系統的彈性 AWS - 可用性和超越:了解和提高分佈式系統的彈性 AWS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

可用性和超越:了解和提高分佈式系統的彈性 AWS

出版日期:二零二一年十一月十二文件歷史紀錄

如今,企業在雲端和內部部署中運作複雜的分散式系統。他們希望這些工作負載具有彈性,以便為客戶提供服務並實現其業務成果。本白皮書概述了可用性的共同理解,作為恢復性的衡量方法,建立了建立高可用性工作負載的規則,並提供有關如何提高工作負載可用性的指導。

簡介

建置高可用性工作負載意味著什麼? 您如何衡量可用性? 我該怎麼做才能提高工作負載的可用性? 本文件將幫助您回答這些類型的問題。它分為三個主要部分。第一節,了解可用性在很大程度上是理論上的。它建立了可用性的定義和影響它的因素的共同理解。第二節「測量可用性」提供有關以實證方式衡量工作負載可用性的指導。第三部分,在上設計高可用性的分散式系統AWS是第一節中介紹的想法的實際應用。此外,在這些章節中,本白皮書將識別用於建置彈性工作負載的規則。本文件旨在支援「AWS架構良好的可靠性支柱」中提供的指導和最佳實務。

在本論文中,您將遇到很多代數數學。關鍵要點是這個數學支持的概念,而不是數學本身。也就是說,這也是本文提出挑戰的意圖。當您操作高可用性工作負載時,您需要能夠在數學上證明您建置的內容正在實現您的預期。即使是建立在良好意圖上的最佳設計,也可能無法始終達到預期的結果。這意味著您需要測量解決方案有效性的機制,因此在構建和操作具有彈性且高可用性的分佈式系統時,需要某種程度的數學。