本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Outpost 維護
在共同責任模式
警告
如果底層的磁碟機故障,或者如果執行個體停止、休眠或終止,執行個體儲存體磁碟區上的資料就會遺失。為了防止資料遺失,建議您將執行個體儲存體磁碟區上的長期資料備份到持久性儲存,例如 Amazon S3 儲存貯體、Amazon EBS 磁碟區或內部部署網路中的網路儲存裝置。
硬體維護
如果 AWS 偵測到在 Outpost 上執行的硬體託管 Amazon EC2 執行個體存在無法彌補的問題,我們會通知 Outpost 的擁有者和執行個體的擁有者,告知受影響的執行個體排定停用。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的《執行個體淘汰》。
Outpost 擁有者和執行個體擁有者可以共同解決問題。執行個體擁有者可以停止並啟動受影響的執行個體,將其移轉至可用的容量。執行個體擁有者可以在方便時停止並啟動受影響的執行個體。否則, AWS 會在執行個體淘汰日期停止並啟動受影響的執行個體。如果 Outpost 上沒有額外的容量,執行個體會繼續處於已停止狀態。Outpost 擁有者可以嘗試釋放已使用的容量或要求 Outpost 的額外容量,以便完成移轉。
如果需要維護硬件, AWS 將與 Outpost 站點的經理聯繫以確認 AWS 安裝團隊訪問的日期和時間。最快可在站點經理與 AWS 團隊交談當日的兩個工作天內安排到訪。
當 AWS 安裝團隊抵達現場時,他們會取代運作狀況不佳的主機、交換器或機架元件,並將新容量上線。他們不會在現場執行任何硬體診斷或維修。如果他們更換了主機,就會移除並銷毀 NIST 相容的實體安全金鑰,進而有效地銷毀任何可能保留在硬體上的資料。如此即可確保不會有任何資料離開您的站點。如果他們更換了 Outpost 網路裝置,當該裝置從站點移除時,網路組態資訊可能會出現在裝置上。此資訊可能包括 IP 地址和 ASN,這些項目是用來建立虛擬介面,以設定本機網路徑或返回區域的路徑。
韌體更新
更新 Outpost 韌體通常不會影響 Outpost 上的執行個體。在極少數情況下,我們需要重新啟動 Outpost 設備才能安裝更新,您會收到在該容量上執行之任何執行個體的執行個體淘汰通知。
網路設備維護
在不影響正常 Outpost 操作和流量的情況下,執行 Outpost 網路裝置 (OND) 的維護。如果需要進行維護,則會從 OND 轉移流量。您可能會注意到 BGP 公告中的暫時變更 (例如在前面加上 AS-Path),以及 Outpost 上行鏈路之流量模式中的相應變更。在 OND 韌體更新時,您可能會注意到 BGP 震盪。
建議您將客戶網路設備設定為接收來自 Outpost 的 BGP 公告,而不變更 BGP 屬性,並啟用 BGP 多路徑/負載平衡以獲得最佳傳入流量。在本機閘道字首前面加上 AS-Path,以在需要維護時從 OND 轉移流量。客戶網路應優先使用 Outpost 中 AS-Path 長度為 1 的路由,而不是 AS-Path 長度為 4 的路由。
客戶網路應向所有 OND 公告具有相同屬性的等量 BGP 字首。Outpost 網路負載預設會平衡所有上行鏈路之間的傳出流量。Outpost 端使用了路由政策,可在需要維護時從 OND 轉移流量。此流量轉移需要所有 OND 上的客戶端都有等量 BGP 字首。如果客戶網路需要維護,建議您在前面加上 AS-Path 以暫時從特定上行鏈路轉移流量。
AWS Outposts 電源和網路事件的最佳做法
正如 AWS Outposts 客戶AWS 服務條款
電源事件
在完全停電的情況下,存在 AWS Outposts 資源可能無法自動返回服務的固有風險。除了部署備援電源和備用電源解決方案之外,建議您事先執行下列動作,以減輕某些最壞情況的影響:
-
使用 DNS 架構或機架外負載平衡變更,以受控方式將您的服務和應用程式從 Outpost 設備移出。
-
以循序增量方式停止容器、執行個體和資料庫,並在還原時使用相反的順序。
-
測試服務的受控移動或停止計畫。
-
備份關鍵資料和組態,並將其儲存在 Outpost 之外。
-
將停電的停機時間降至最低。
-
避免在維護期間重複切換電源供應器 (off-on-off-on)。
-
在維護時段內允許額外的時間來處理意外情況。
-
透過傳達比一般所需更寬的維護時段時間範圍來管理使用者和客戶的期望。
網路連線事件
您的 Outpost 與 AWS 區域或 Outposts 所在地區之間的服務連結連線通常會在網路維護完成後,自動從上游公司網路裝置或任何第三方連線供應商網路中可能發生的網路中斷或問題中復原。在服務連結連線中斷期間,您的 Outpost 操作僅限於本機網路活動。
如需詳細資訊,請參閱《AWS Outposts 機架常見問答集
如果服務連結因為現場電源問題或網路連線中斷,會 AWS Health Dashboard 傳送通知給擁有 Outposts 的帳戶。您也不 AWS 能禁止服務鏈接中斷的通知,即使預期中斷也是如此。如需詳細資訊,請參閱《 指南》中的《AWS Health AWS Health Dashboard入門》。
如果計畫的服務維護會影響網路連線,請採取下列主動步驟來限制潛在問題情況的影響:
-
如果您的 Outposts 機架通過互聯網或公共 Direct Connect 連接到父 AWS 區域,那麼在計劃的維護之前,捕獲跟踪路線。有一個有效的(pre-network-maintenance)網絡路徑和有問題的(post-network-maintenance)網絡路徑來識別差異將有助於故障排除。如果您將維護後的問題升級到 AWS 或您的 ISP,則可以包含此資訊。
擷取下列項目之間的 trace-route:
-
位於 Outpost 位置的公有 IP 地址,以及
outposts.
傳回的 IP 地址。將region
.amazonaws.com區域
替換為父 AWS 區域的名稱。 -
父區域中任何具有公有網際網路連線的執行個體,以及位於 Outpost 位置的公有 IP 地址。
-
-
如果網路維護在您的控制下,請限制服務連結的停機時間。在維護程序中加入驗證網路是否已復原的步驟。
-
如果網路維護不在您的控制下,請監控與宣布維護時段相關的服務連結停機時間,如果服務連結未在宣布的維護時段結束時恢復上線,請及早向負責計畫網路維護的一方呈報。
資源
以下是一些監控相關資源,這些資源可確保 Outpost 在計畫或意外的電源或網路事件發生之後正常運作:
-
AWS 博客監控最佳實踐 AWS Outposts涵蓋了
Outposts 特定的可觀察性和事件管理最佳實踐。 -
Amazon VPC 網路連線的 AWS 部落格偵錯工具說明了 AWSSupport-Setu MonitoringFrom Pip VPC
工具。此工具是一份 AWS Systems Manager 文件 (SSM 文件),可在您指定的子網路中建立 Amazon EC2 監視器執行個體並監控目標 IP 地址。此文件會執行 ping、MTR、TCP 追蹤路由和追蹤路徑診斷測試,並將結果儲存在 Amazon CloudWatch Logs 中,並可在 CloudWatch 儀表板中視覺化 (例如延遲、封包遺失)。對於 Outposts 監控,監控執行個體應位於父 AWS 區域的一個子網路中,並設定為使用其私有 IP 監視一或多個 Outpost 執行個體-這將提供和父 AWS 區域之間的封包遺失圖形 AWS Outposts 和延遲。 -
部署自動化 Amazon CloudWatch 儀表板以供 AWS Outposts 使用的部 AWS
落格 AWS CDK說明部署自動化儀表板所涉及的步驟。 -
如果您有疑問或需要更多資訊,請參閱《AWS Support 使用者指南》中的《建立支援案例》。