監控您的 Amazon EBS 卷 - Amazon EBS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控您的 Amazon EBS 卷

AWS 自動提供您可用來監控 Amazon EBS 磁碟區的資料。

如需其他監控資訊,請參閱 Amazon E CloudWatch BS 的 Amazon 指標Amazon EventBridge 的 Amazon EBS

EBS 磁碟區狀態檢查

磁碟區狀態檢查可讓您更清楚了解、追蹤及管理 Amazon EBS 磁碟區資料中的潛在不一致性。這些檢查的設計旨在提供您判斷 Amazon EBS 磁碟區是否受損的資訊,並協助您控制如何處理磁碟區中的潛在不一致性。

磁碟區狀態檢查是一種自動化測試,於每 5 分鐘執行一次,並會傳回通過或失敗狀態。如果所有檢查都通過,磁碟區的狀態即為 ok。如果檢查未通過,磁碟區的狀態即為 impaired。如果狀態為 insufficient-data,則磁碟區上的檢查可能仍在進行。您可以檢視磁碟區狀態檢查的結果,以找出任何受損磁碟區,並執行任何必要動作。

當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O,有助於避免資料損毀。停用 I/O 之後,下一次磁碟區狀態檢查就不會通過,且磁碟區狀態為 impaired。除此之外,還會顯示一則事件,通知您 I/O 已停用,且您可以啟用對磁碟區的 I/O 以解決磁碟區的受損狀態。我們會等到您啟用 I/O,讓您有機會決定是否繼續讓執行個體使用磁碟區,還是使用命令 (例如 fsck (Linux 執行個體) 或 chkdsk (Windows 執行個體) 執行一致性檢查,然後再執行這項操作。

注意

磁碟區狀態是以磁碟區狀態檢查為依據,而不會反映磁碟區狀態。因此,磁碟區狀態不會指出 error 狀態中的磁碟區 (例如,當磁碟區無法接受 I/O 時。)如需磁碟區狀態的資訊,請參閱磁碟區狀態

如果您不關切特定磁碟區的一致性,並傾向在磁碟區受損時立即供使用者使用,您可以將磁碟區設為自動啟用 I/O,以覆寫預設行為。如果您啟用 Auto-Enable IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO),磁碟區狀態檢查即可繼續通過。除此之外,還會顯示一則事件,通知您已判定出磁碟區具有潛在不一致性,但已自動啟用 I/O。這可讓您檢查磁碟區的一致性或於日後將其取代。

I/O 效能狀態檢查會比較磁碟區的實際效能與預期效能。如果磁碟區的效能低於預期,則會提醒您。此狀態檢查僅適用於連接至執行個體的佈建 IOPS SSD (io1io2) 及一般用途 SSD (gp3) 磁碟區。狀態檢查不適用於一般用途 SSD (gp2)、輸送量最佳化 HDD (st1)、冷 HDD (sc1) 或磁性 (standard) 磁碟區。I/O 效能狀態檢查會每分鐘執行一次,並每 5 分鐘 CloudWatch 收集一次此資料。從您連接 io1io2 磁碟區到執行個體的那一刻起,最多可能需要 5 分鐘的時間,才能進行狀態檢查,以報告 I/O 效能狀態。

重要

在初始化從快照還原的 Provisioned IOPS SSD 磁碟區時,磁碟區的效能可能會降到預期的 50% 以下,並導致磁碟區在 I/O Performance (I/O 效能) 狀態檢查中顯示 warning 狀態。這是預期的情況,因此在初始化 Provisioned IOPS SSD 磁碟區時,您可以忽略這些磁碟區的 warning 狀態。如需詳細資訊,請參閱 初始化 Amazon EBS 磁碟區

下表所列的是 Amazon EBS 磁碟區的狀態。

磁碟區狀態 I/O 已啟用狀態 I/O 效能狀態 (僅限 io1io2gp3 磁碟區)

ok

已啟用 (I/O 已啟用或 I/O 自動啟用)

正常 (磁碟區效能如預期)

warning

已啟用 (I/O 已啟用或 I/O 自動啟用)

降級 (磁碟區效能低於預期)

嚴重降級 (磁碟區效能大幅低於預期)

impaired

已啟用 (I/O 已啟用或 I/O 自動啟用)

已停用 (磁碟區已離線且等待復原中,或正在等待使用者啟用 I/O)

已停滯 (磁碟區效能嚴重受損)

無法使用 (無法確定 I/O 效能,因為 I/O 已停用)

insufficient-data

已啟用 (I/O 已啟用或 I/O 自動啟用)

資料不足

資料不足

您可以使用下列方法來檢視和使用狀態檢查。

Console
檢視狀態檢查
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Volumes (磁碟區)

    Volume Status (磁碟區狀態) 欄會顯示每個磁碟區的操作狀態。

  3. 若要檢視特定磁碟區的狀態詳細資訊,請在網格中選取它,然後選取 Status checks (狀態檢查)。

  4. 如果您具有狀態檢查失敗的磁碟區 (狀態為 impaired),請參閱使用受損磁碟區

或者,您可以在導覽器中選擇 Events (事件) ,以檢視執行個體和磁碟區的所有事件。如需詳細資訊,請參閱 EBS 磁碟區事件

AWS CLI
檢視磁碟區狀態資訊

使用 describe-volume-status 命令。

如需有關這些命令列界面的詳細資訊,請參閱存取 Amazon EC2

Tools for Windows PowerShell
檢視磁碟區狀態資訊

使用取得 EC2 命令VolumeStatus

如需有關這些命令列界面的詳細資訊,請參閱存取 Amazon EC2

EBS 磁碟區事件

當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O。這會導致磁碟區狀態檢查未通過,並建立磁碟區狀態事件以指出導致未通過的原因。

若要自動啟用具潛在資料不一致性之磁碟區的 I/O,請變更 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO) 的設定。如需如何變更這個屬性的詳細資訊,請參閱使用受損磁碟區

每個事件都包括開始時間 (指出事件發生的時間) 以及持續時間 (指出磁碟區的 I/O 停用多長時間)。當磁碟區的 I/O 啟用時,事件就會新增結束時間。

磁碟區狀態事件包含下列其中一個說明:

Awaiting Action: Enable IO

磁碟區具有潛在的資料不一致性。會停用磁碟區的 I/O 直到您明確啟用為止。在您明確啟用 I/O 之後,事件說明會變更為 IO Enabled

IO Enabled

會明確啟用這個磁碟區的 I/O 操作。

IO Auto-Enabled

事件發生之後,會自動啟用這個磁碟區的 I/O 操作。建議您在繼續使用資料之前,先檢查是否有資料不一致性。

Normal

僅適用於 io1io2gp3 磁碟區。磁碟區效能如預期。

Degraded

僅適用於 io1io2gp3 磁碟區。磁碟區效能低於預期。

Severely Degraded

僅適用於 io1io2gp3 磁碟區。磁碟區效能大幅低於預期。

Stalled

僅適用於 io1io2gp3 磁碟區。磁碟區效能嚴重受損。

您可以使用下列方法來檢視磁碟區的事件。

Console
檢視磁碟區的事件
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Events (事件)。即會列出所有含有事件的執行個體和磁碟區。

  3. 您可以依磁碟區篩選,只檢視磁碟區狀態。您也可以篩選特定的狀態類型。

  4. 選取磁碟區,以檢視其特定事件。

AWS CLI
檢視磁碟區的事件

使用 describe-volume-status 命令。

如需有關這些命令列界面的詳細資訊,請參閱存取 Amazon EC2

Tools for Windows PowerShell
檢視磁碟區的事件

使用取得 EC2 命令VolumeStatus

如需有關這些命令列界面的詳細資訊,請參閱存取 Amazon EC2

如果您有已停用 I/O 的磁碟區,請參閱使用受損磁碟區。如果您磁碟區的 I/O 效能低於正常情況,這可能是您執行之動作 (例如,在峰值使用期間建立磁碟區快照、在不支援必要 I/O 頻寬的執行個體上執行磁碟區、首次存取磁碟區的資料等) 所致的暫時性狀況。

使用受損磁碟區

在因磁碟區的資料具有潛在不一致性而導致磁碟區受損的情況下,請使用下列選項。

選項 1:對連接至執行個體的磁碟區執行一致性檢查

最簡單的選項為啟用 I/O,然後對磁碟區執行資料一致性檢查,同時磁碟區仍連接至 Amazon EC2 執行個體。

對連接的磁碟區執行一致性檢查
  1. 停止讓任何應用程式使用磁碟區。

  2. 啟用磁碟區的 I/O。使用下列其中一種方法。

    Console
    1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

    2. 在導覽窗格中,選擇 Events (事件)。

    3. 選取磁碟區以啟用其 I/O 操作。

    4. 選擇 Actions (動作)、Enable I/O (啟用 I/O)。

    AWS CLI
    若要啟用磁碟區的 I/O AWS CLI

    使用 enable-volume-io 命令。

    Tools for Windows PowerShell
    使用視窗適用的工具啟用磁碟區的 I/O PowerShell

    使用 Enable-EC2VolumeIO 命令。

  3. 檢查磁碟區上的資料。

    1. 執行 fsck (Linux 執行個體) 或 chkdsk (視窗執行個體) 命令。

    2. (選用) 檢閱任何可用的應用程式或系統日誌,以取得相關的錯誤訊息。

    3. 如果音量受損超過 20 分鐘,您可以聯繫 Sup AWS port 中心。選擇 Troubleshoot (故障診斷),然後在 Troubleshoot Status Checks (為狀態檢查進行故障診斷) 對話方塊中選擇 Contact Support (聯絡支援),以提交支援案例。

選項 2:對使用其他執行個體的磁碟區執行一致性檢查

請使用下列步驟來檢查生產環境外的磁碟區。

重要

若在磁碟區 I/O 停用時暫停寫入 I/O 作業,此程序可能會造成該寫入 I/O 資料的遺失。

對隔離的磁碟區執行一致性檢查
  1. 停止讓任何應用程式使用磁碟區。

  2. 將磁碟區從執行個體分離。如需詳細資訊,請參閱 從執行個體中分離 Amazon EBS 磁碟區

  3. 啟用磁碟區的 I/O。使用下列其中一種方法。

    Console
    1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

    2. 在導覽窗格中,選擇 Events (事件)。

    3. 選取您在上一個步驟中分離的磁碟區。

    4. 選擇 Actions (動作)、Enable I/O (啟用 I/O)。

    AWS CLI
    若要啟用磁碟區的 I/O AWS CLI

    使用 enable-volume-io 命令。

    Tools for Windows PowerShell
    使用視窗適用的工具啟用磁碟區的 I/O PowerShell

    使用 Enable-EC2VolumeIO 命令。

  4. 將磁碟區連接至另一個執行個體。如需詳細資訊,請參閱啟動您的執行個體將 Amazon EBS 磁碟區連接至執行個體

  5. 檢查磁碟區上的資料。

    1. 執行 fsck (Linux 執行個體) 或 chkdsk (視窗執行個體) 命令。

    2. (選用) 檢閱任何可用的應用程式或系統日誌,以取得相關的錯誤訊息。

    3. 如果音量受損超過 20 分鐘,您可以聯繫 Sup AWS port 中心。選擇 Troubleshoot (故障診斷),然後在故障診斷對話方塊中選擇 Contact Support (聯絡支援),以提交支援案例。

選項 3:刪除您不再需要的磁碟區

如果您想要將環境中的磁碟區移除,只要將其移除即可。如需刪除磁碟區的資訊,請參閱刪除 Amazon EBS 磁碟區

如果您有最近的快照,其備份了磁碟區上的資料,則您可以從該快照建立新的磁碟區。如需詳細資訊,請參閱 從快照建立磁碟區

使用 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性

當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O。這會導致磁碟區狀態檢查未通過,並建立磁碟區狀態事件以指出導致未通過的原因。如果您不關切特定磁碟區的一致性,並傾向在磁碟區受損時立即供使用者使用,您可以將磁碟區設為自動啟用 I/O,以覆寫預設行為。如果您啟用 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO),磁碟區和執行個體之間的 I/O 就會自動重新啟用,並且磁碟區的狀態檢查將通過。除此之外,還會顯示一則事件,通知您磁碟區的狀態具有潛在不一致性,但已自動啟用 I/O。發生此事件時,您應該檢查磁碟區的一致性並視需要將其取代。如需詳細資訊,請參閱 EBS 磁碟區事件

您可以使用下列其中一種方法來檢視及修改磁碟區的 Auto-Enabled IO (自動啟用 IO) 屬性。

Amazon EC2 console
檢視磁碟區的 Auto-Enabled IO (自動啟用 IO) 屬性
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Volumes (磁碟區)。

  3. 選取磁碟區,並選取 Status checks (狀態檢查) 索引標籤。

    Auto-enabled IO (自動啟用 IO) 欄位會顯示所選磁碟區的目前設定 Enabled (已啟用) 或 Disabled (已停用))。

修改磁碟區的 Auto-Enabled IO (自動啟用 IO) 屬性
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Volumes (磁碟區)。

  3. 選取磁碟區,並選取 Actions (動作)、Manage Auto-enabled I/O (管理自動啟用 I/O)。

  4. 若要對受損磁碟區自動啟用 I/O,請選取 Auto-enable I/O for impaired volumes (對受損磁碟區自動啟用 IO) 核取方塊。若要停用這項功能,請清除核取方塊。

  5. 選擇更新

AWS CLI
檢視磁碟區的 autoEnableIO 屬性

使用 describe-volume-attribute 命令。

修改磁碟區的 autoEnableIO 屬性

使用 modify-volume-attribute 命令。

如需有關這些命令列界面的詳細資訊,請參閱存取 Amazon EC2

Tools for Windows PowerShell
檢視磁碟區的 autoEnableIO 屬性

使用取得 EC2 命令VolumeAttribute

修改磁碟區的 autoEnableIO 屬性

使用編輯 EC2 命令VolumeAttribute

如需有關這些命令列界面的詳細資訊,請參閱存取 Amazon EC2