針對 VM 問題進行故障診斷 - AWS Backup

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

針對 VM 問題進行故障診斷

增量備份/CBT問題和訊息

失敗訊息: "The VMware Change Block Tracking (CBT) data was invalid during this backup, but the incremental backup was successfully completed with our proprietary change detection mechanism."

如果此訊息繼續,請依照 的指示重設CBTVMware。

訊息備註CBT未開啟或無法使用:「VMware變更區塊追蹤 (CBT) 不適用於此虛擬機器,但增量備份已透過我們的專屬變更機制成功完成。」

檢查 以確認 CBT 已開啟。若要驗證虛擬磁碟是否CBT已啟用:

  1. 開啟 vSphere 用戶端,然後選擇關閉電源的虛擬機器。

  2. 以滑鼠右鍵按一下虛擬機器,然後導覽至 編輯設定 > 選項 > 進階/一般 > 組態參數

  3. 選項 ctkEnabled 必須為 True

如果已開啟,請確定您使用 up-to-date VMware功能。主機必須是 ESXi 4.0 或更新版本,擁有要追蹤之磁碟的虛擬機器必須是硬體第 7 版或更新版本。

如果 CBT 已開啟 (已啟用),且軟體和硬體為最新版本,請關閉虛擬機器,然後再次開啟虛擬機器。確定 CBT 已開啟。然後,再次執行備份。

VMware 備份失敗

當VMware備份失敗時,可能與下列其中一項有關:

失敗訊息: "Failed to process backup data. Aborted backup job.""Error opening disk on the virtual machine"

可能原因:此錯誤可能因組態問題而發生;或者不支援VMware版本或磁碟。

修正方法 1:確保您的基礎設施已設定為使用閘道,並確保所有必要的連接埠都已開啟。

  1. 存取備份閘道主控台 。請注意,這與 AWS Backup 主控台不同。

  2. 備份閘道組態頁面上,輸入選項 3 以測試網路連線。

  3. 如果網路測試成功,請輸入 X

  4. 返回備份閘道組態頁面。

  5. 輸入 7 以存取命令提示字元。

  6. 執行下列命令來驗證網路連線:

    ncport -d ESXi Host-p 902

    ncport -d ESXi Host-p 443

Remedy 2:使用 支援的 VMs 版本。

修正方法 3:如果閘道設備設定不正確的DNS伺服器,則備份會失敗。若要驗證DNS組態,請完成下列步驟:

  1. 存取備份閘道主控台

  2. 備份閘道組態頁面上,輸入選項 2 以導覽至網路組態。

  3. 網路組態 中,輸入 7 以檢視DNS組態。

  4. 檢閱DNS伺服器 IP 地址。如果DNS伺服器 IP 地址不正確,則會出現提示以返回 Network Configuration

  5. 網路組態 中,輸入 6 以編輯DNS組態。

  6. 輸入正確的DNS伺服器 IP 地址。然後,輸入 X 以完成網路組態。

若要取得 Hypervisor 的詳細資訊,例如錯誤和網路組態和連線,請參閱 編輯 Hypervisor 組態 將 Hypervisor 設定為與 Amazon CloudWatch Logs 整合。

網路連線問題的備份失敗

失敗訊息: "Failed to upload backup during data ingestion. Aborted backup job.""Cloud network request timed out during data ingestion"

可能原因:如果網路連線不足以處理資料上傳,可能會發生此錯誤。如果網路頻寬低,VM 和 之間的連結 AWS Backup 可能會變得擁塞,並導致備份失敗。

所需的網路頻寬取決於幾個因素,包括 VM 的大小、為每個 VM 備份產生的增量資料、備份時段和還原需求。

補救措施:最佳實務和建議包括對VMs連接至 的內部部署具有 1000 Mbps 的最小頻寬上傳頻寬 AWS Backup。確認頻寬後,重試備份任務。

已中止備份任務

失敗訊息: "Failed to create backup during snapshot creation. Aborted backup job."

可能原因:閘道設備所在的VMware主機可能會出現問題。

修正:檢查VMware主機的組態,並檢閱是否有問題。如需其他資訊,請參閱 編輯 Hypervisor 組態

沒有可用的閘道

失敗訊息: "No gateways available to work on job."

可能的原因:所有連接的閘道都忙於處理其他任務。每個閘道最多有四個並行任務 (備份或還原)。

如需補救措施 ,請參閱下一節,了解增加閘道數量的步驟,以及增加備份計劃時段時間的步驟。

VMware 備份任務失敗

失敗訊息:"Abort signal detected"

可能原因:

  • 低網路頻寬 :網路頻寬不足可能會阻礙完成時段內的備份完成。當備份任務需要的頻寬超過可用時,可能會導致失敗並觸發「偵測到的中止訊號」錯誤。

  • 備份閘道數量不足:如果備份閘道的數量不足以處理所有已設定 的備份輪換VMs,備份任務可能會失敗。當備份計劃完成備份的時段太短或備份閘道的數量不足時,就會發生這種情況。

  • 備份計畫完成時段太小。

補救措施:

增加頻寬:考慮增加 AWS 和內部部署環境之間的網路容量。此步驟將為備份程序提供更多頻寬,允許資料順利傳輸,而不會觸發錯誤。建議您至少擁有 100-Mbps 的頻寬 AWS ,以便VMwareVMs使用 備份內部部署 AWS Backup。

如果為備份閘道設定頻寬速率限制,則可能會限制資料流程並導致備份失敗。增加頻寬速率限制以確保足夠的資料傳輸容量,可能有助於減少故障。此調整可以減少「偵測到的中止訊號」錯誤發生。如需詳細資訊,請參閱備份閘道頻寬限流

增加備份閘道的數量:單一備份閘道一次最多可以處理 4 個備份和還原任務。其他任務將排入佇列,並等待閘道釋放,直到備份開始時段通過為止。如果備份時段通過且佇列任務尚未啟動,這些備份任務將會失敗,並偵測到「中斷訊號」。您可以增加備份閘道的數量,以減輕失敗任務的數量。如需更多詳細資訊使用閘道,請參閱 。

增加備份計畫時段時間:您可以在備份計畫中備份時段的持續時間內增加完成。如需更多詳細資訊備份計畫選項和組態,請參閱 。

如需解決這些問題的協助,請參閱 AWS 知識中心