本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
可靠性支柱
AWS Well-Architected Framework 可靠性支柱包含工作負載在預期情況下正確且一致地執行其預期函數的能力。這包括在整個生命週期中操作和測試工作負載的能力。
可靠的工作負載始於對軟體和基礎設施的前期設計決策。您的架構選擇會影響所有 Well-Architected 支柱的工作負載行為。為了可靠性,您必須遵循特定模式,如本節所述。
可靠性支柱著重於下列關鍵領域:
-
工作負載架構,包括服務配額和部署模式
-
變更管理
-
故障管理
了解 Neptune 服務配額
AWS 您的帳戶具有每個 的預設配額 (先前稱為限制) AWS 服務。除非另有說明,否則每個配額都是區域特定規定。您可以請求提高部分配額,但並非所有配額。
若要尋找 Neptune Analytics 的配額,請開啟 Service Quotas 主控台
如果最大佈建記憶體不足以容納您的資料集,請評估哪些節點和邊緣類型對您的預期分析使用量至關重要。載入一部分的資料,以便在允許的佈建容量內進行分析。許多分析工作負載,特別是執行圖形演算法的工作負載,只需要具有有限屬性集的拓撲,而不是完整的交易圖形。(如需交易工作負載與分析工作負載之間差異的討論,請參閱效能效率支柱一節。)
如果圖形數量上限不足以滿足您的預期用途:
-
考慮合併具有類似用途的圖形。
-
評估在特定時間必須執行的圖形數量。如果您有暫時性分析使用案例,請快照並在不再需要圖形時將其刪除。這會減少針對配額的圖形數量。
-
考慮在不同的 中佈建圖形 AWS 帳戶。
了解 Neptune 部署模式
當您計劃部署 Neptune Analytics 圖形時,請了解下列決策點:
-
植入:使用來自 Amazon S3、現有 Neptune 資料庫叢集或現有 Neptune 資料庫快照的資料,決定是否建立空白圖形或在建立時將資料載入其中。
建議:如果來源是 Neptune 叢集或快照,您必須在圖形建立時載入其資料。如果來源是 Amazon S3,則在建立時載入資料,如果載入資料的工作是重要的,且最好作為基礎設施佈建活動執行。如果您偏好將資料載入為資料工程或應用程式活動,請建立空白圖形,稍後再從 Amazon S3 載入資料。
-
容量:根據資料大小和預期的應用程式用量,估計圖形所需的佈建容量。
建議:在建立時,指定最大佈建記憶體以限制圖形大小。此設定是強制性的。您可以視需要稍後變更容量。
-
可用性和容錯能力:決定是否需要複本才能使用。複本可做為暖待命,以便在圖形故障時進行復原。具有複本的圖形復原速度比不含複本的圖形更快。另請考量圖形需要多長時間、是否僅用於暫時性分析,以及何時將其移除。
建議:建立圖形之前,請先判斷可用性需求,例如圖形無法使用的時間長度以及可以移除的時間。
-
網路和安全性:判斷您是否需要公有連線、私有連線或兩者,以及是否要加密資料。
建議:在建立圖形之前,了解組織需求,例如是否允許公有連線,以及圖形用戶端應用程式將部署的位置。
-
備份和復原:確定是否應建立快照,如果是,則確定何時或在哪些條件下建立快照。考慮您的組織是否具有災難復原 (DR) 要求。
建議:建立快照是一種手動活動。在建立圖形之前,決定何時建立快照並考慮您的 DR 需求。
管理和擴展 Neptune 叢集
Neptune Analytics 圖形包含單一的記憶體最佳化執行個體。執行個體的容量 (m-NCU) 是在建立時設定。透過管理動作增加佈建容量,即可垂直擴展執行個體;也可以減少佈建容量。複本是被動容錯移轉目標,因此不會增加圖形的規模。在此方面,圖形複本與 Neptune 資料庫僅供讀取複本不同,Neptune 叢集中的作用中執行個體可以處理來自應用程式的讀取操作。
複本會產生成本。複本是以圖形的 m-NCU 速率定價。例如,如果為 128 m-NCU 佈建圖形且具有單一複本,則成本為沒有複本之對等圖形的兩倍。
在分析中,擴展有兩個主要原因:
-
為了為分析查詢和演算法提供更多記憶體和 CPU,因為個別查詢的成本很高,要執行的圖形演算法本質上很複雜,並且需要更多的資源,或者並行請求率很高。如果這類查詢遇到out-of-memory錯誤,向上擴展是合理的補救措施。
-
支援比您計劃更大的圖形大小。例如,如果目前佈建的容量為 128 m-NCU 以支援 60 GB 的來源資料,而且您需要額外的 40 GB 的來源資料,則需要增加到 256 m-NCU。
監控 Neptune Analytics 的 CloudWatch NumOpenCypherRequestsPerSec
指標,例如 NumQueuedRequestsPerSec
、GraphSizeBytes
、、 GraphStorageUsagePercent
和 CPUUtilization
,以判斷是否需要擴展。您可以透過 主控台 AWS CLI或 SDKs 更新圖形的組態。(如需範例和最佳實務,請參閱卓越營運支柱一節。)
管理備份和容錯移轉事件
使用複本來確保圖形在故障時仍然可用。圖形使用以日誌為基礎的持久性來遞交 中可用區域之間的變更 AWS 區域。複本可做為暖待命,並可存取此資料。如果發生故障,圖形會繼續對複本執行操作。應用程式會繼續使用相同的端點來連線至圖形。故障期間進行中的請求會產生服務無法使用例外狀況的錯誤。請考慮在應用程式程式碼中使用具有退避模式的重試來捕捉錯誤,並在短暫間隔後再試一次。在容錯移轉期間提出的新請求會排入佇列,並可能會遇到較長的延遲。
如果未設定複本且圖形失敗,Neptune Analytics 會從持久性儲存體復原,但復原需要更長的時間,因為 Neptune 必須重新初始化資源。
建立圖形的快照。(Neptune Analytics 不會拍攝自動快照。) 如果在建立之後定期修改圖形,請經常拍攝快照以擷取其目前狀態。如果不需要還原至較早的時間點,請刪除較舊的快照。
您可以與其他 帳戶和跨 共用快照 AWS 區域。如果您有 DR 需求,請考慮在快照的不同區域中還原圖形是否符合您的復原時間目標 (RTO) 和復原點目標 (RPO) 需求。