監控您的磁碟區狀態 - Amazon Elastic Compute Cloud

監控您的磁碟區狀態

Amazon Web Services (AWS) 會自動提供您可用來監控 Amazon Elastic Block Store (Amazon EBS) 磁碟區的資料。

如需其他監控資訊,請參閱 Amazon EBS 的 Amazon CloudWatch 指標適用於 Amazon EBS 的 EventBridge

EBS 磁碟區狀態檢查

磁碟區狀態檢查可讓您更清楚了解、追蹤及管理 Amazon EBS 磁碟區資料中的潛在不一致性。這些檢查的設計旨在提供您判斷 Amazon EBS 磁碟區是否受損的資訊,並協助您控制如何處理磁碟區中的潛在不一致性。

磁碟區狀態檢查是一種自動化測試,於每 5 分鐘執行一次,並會傳回通過或失敗狀態。如果所有檢查都通過,磁碟區的狀態即為 ok。如果檢查未通過,磁碟區的狀態即為 impaired。如果狀態為 insufficient-data,則磁碟區上的檢查可能仍在進行。您可以檢視磁碟區狀態檢查的結果,以找出任何受損磁碟區,並執行任何必要動作。

當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O,有助於避免資料損毀。停用 I/O 之後,下一次磁碟區狀態檢查就不會通過,且磁碟區狀態為 impaired。除此之外,還會顯示一則事件,通知您 I/O 已停用,且您可以啟用對磁碟區的 I/O 以解決磁碟區的受損狀態。我們會等待您啟用 I/O,讓您有機會決定要繼續讓執行個體使用磁碟區,還是要先使用 fsck 這類命令執行一致性檢查再決定。

注意

磁碟區狀態是以磁碟區狀態檢查為依據,而不會反映磁碟區狀態。因此,磁碟區狀態不會指出 error 狀態中的磁碟區 (例如,當磁碟區無法接受 I/O 時。)如需磁碟區狀態的資訊,請參閱磁碟區狀態

如果您不關切特定磁碟區的一致性,並傾向在磁碟區受損時立即供使用者使用,您可以將磁碟區設為自動啟用 I/O,以覆寫預設行為。如果您啟用 Auto-Enable IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO),磁碟區狀態檢查即可繼續通過。除此之外,還會顯示一則事件,通知您已判定出磁碟區具有潛在不一致性,但已自動啟用 I/O。這可讓您檢查磁碟區的一致性或於日後將其取代。

I/O 效能狀態檢查會比較磁碟區的實際效能與預期效能。如果磁碟區的效能低於預期,則會提醒您。此狀態檢查僅適用於連接至執行個體的佈建 IOPS SSD (io1io2) 及一般用途 SSD (gp3) 磁碟區。狀態檢查不適用於一般用途 SSD (gp2)、輸送量最佳化 HDD (st1)、冷 HDD (sc1) 或磁性 (standard) 磁碟區。I/O 效能狀態檢查每分鐘執行一次,並每 5 分鐘 CloudWatch 收集一次此資料。從您連接 io1io2 磁碟區到執行個體的那一刻起,最多可能需要 5 分鐘的時間,才能進行狀態檢查,以報告 I/O 效能狀態。

重要

在初始化從快照還原的 Provisioned IOPS SSD 磁碟區時,磁碟區的效能可能會降到預期的 50% 以下,並導致磁碟區在 I/O Performance (I/O 效能) 狀態檢查中顯示 warning 狀態。這是預期的情況,因此在初始化 Provisioned IOPS SSD 磁碟區時,您可以忽略這些磁碟區的 warning 狀態。如需詳細資訊,請參閱 初始化 Amazon EBS 磁碟區

下表所列的是 Amazon EBS 磁碟區的狀態。

磁碟區狀態 I/O 已啟用狀態 I/O 效能狀態 (僅限 io1io2gp3 磁碟區)

ok

已啟用 (I/O 已啟用或 I/O 自動啟用)

正常 (磁碟區效能如預期)

warning

已啟用 (I/O 已啟用或 I/O 自動啟用)

降級 (磁碟區效能低於預期)

嚴重降級 (磁碟區效能大幅低於預期)

impaired

已啟用 (I/O 已啟用或 I/O 自動啟用)

已停用 (磁碟區已離線且等待復原中,或正在等待使用者啟用 I/O)

已停滯 (磁碟區效能嚴重受損)

無法使用 (無法確定 I/O 效能,因為 I/O 已停用)

insufficient-data

已啟用 (I/O 已啟用或 I/O 自動啟用)

資料不足

資料不足

您可以使用下列方法來檢視和使用狀態檢查。

Console
檢視狀態檢查
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Volumes (磁碟區)

    Volume Status (磁碟區狀態) 欄會顯示每個磁碟區的操作狀態。

  3. 若要檢視特定磁碟區的狀態詳細資訊,請在網格中選取它,然後選取 Status checks (狀態檢查)。

  4. 如果您具有狀態檢查失敗的磁碟區 (狀態為 impaired),請參閱使用受損磁碟區

或者,您可以在導覽器中選擇 Events (事件) ,以檢視執行個體和磁碟區的所有事件。如需詳細資訊,請參閱 EBS 磁碟區事件

AWS CLI
檢視磁碟區狀態資訊

請使用下列其中一個命令。

如需關於這些命令列介面的詳細資訊,請參閱 存取 Amazon EC2

EBS 磁碟區事件

當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O。這會導致磁碟區狀態檢查未通過,並建立磁碟區狀態事件以指出導致未通過的原因。

若要自動啟用具潛在資料不一致性之磁碟區的 I/O,請變更 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO) 的設定。如需如何變更這個屬性的詳細資訊,請參閱使用受損磁碟區

每個事件都包括開始時間 (指出事件發生的時間) 以及持續時間 (指出磁碟區的 I/O 停用多長時間)。當磁碟區的 I/O 啟用時,事件就會新增結束時間。

磁碟區狀態事件包含下列其中一個說明:

Awaiting Action: Enable IO

磁碟區具有潛在的資料不一致性。會停用磁碟區的 I/O 直到您明確啟用為止。在您明確啟用 I/O 之後,事件說明會變更為 IO Enabled

IO Enabled

會明確啟用這個磁碟區的 I/O 操作。

IO Auto-Enabled

事件發生之後,會自動啟用這個磁碟區的 I/O 操作。建議您在繼續使用資料之前,先檢查是否有資料不一致性。

Normal

僅適用於 io1io2gp3 磁碟區。磁碟區效能如預期。

Degraded

僅適用於 io1io2gp3 磁碟區。磁碟區效能低於預期。

Severely Degraded

僅適用於 io1io2gp3 磁碟區。磁碟區效能大幅低於預期。

Stalled

僅適用於 io1io2gp3 磁碟區。磁碟區效能嚴重受損。

您可以使用下列方法來檢視磁碟區的事件。

Console
檢視磁碟區的事件
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Events (事件)。即會列出所有含有事件的執行個體和磁碟區。

  3. 您可以依磁碟區篩選,只檢視磁碟區狀態。您也可以篩選特定的狀態類型。

  4. 選取磁碟區,以檢視其特定事件。

AWS CLI
檢視磁碟區的事件

請使用下列其中一個命令。

如需關於這些命令列介面的詳細資訊,請參閱 存取 Amazon EC2

如果您有已停用 I/O 的磁碟區,請參閱使用受損磁碟區。如果您磁碟區的 I/O 效能低於正常情況,這可能是您執行之動作 (例如,在峰值使用期間建立磁碟區快照、在不支援必要 I/O 頻寬的執行個體上執行磁碟區、首次存取磁碟區的資料等) 所致的暫時性狀況。

使用受損磁碟區

在因磁碟區的資料具有潛在不一致性而導致磁碟區受損的情況下,請使用下列選項。

選項 1:對連接至執行個體的磁碟區執行一致性檢查

最簡單的選項為啟用 I/O,然後對磁碟區執行資料一致性檢查,同時磁碟區仍連接至 Amazon EC2 執行個體。

對連接的磁碟區執行一致性檢查
  1. 停止讓任何應用程式使用磁碟區。

  2. 啟用磁碟區的 I/O。使用下列其中一種方法。

    Console
    1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

    2. 在導覽窗格中,選擇 Events (事件)。

    3. 選取磁碟區以啟用其 I/O 操作。

    4. 選擇 Actions (動作)、Enable I/O (啟用 I/O)。

    AWS CLI
    使用命令列來啟用磁碟區的 I/O

    若要檢視 Amazon EBS 磁碟區的事件資訊,您可以使用以下任一命令。如需關於這些命令列介面的詳細資訊,請參閱 存取 Amazon EC2

  3. 檢查磁碟區上的資料。

    1. 執行 fsck 命令。

    2. (選用) 檢閱任何可用的應用程式或系統日誌,以取得相關的錯誤訊息。

    3. 如果磁碟區已受損超過 20 分鐘,您可以聯絡 AWS 支援中心。選擇 Troubleshoot (故障診斷),然後在 Troubleshoot Status Checks (為狀態檢查進行故障診斷) 對話方塊中選擇 Contact Support (聯絡支援),以提交支援案例。

選項 2:對使用其他執行個體的磁碟區執行一致性檢查

請使用下列步驟來檢查生產環境外的磁碟區。

重要

若在磁碟區 I/O 停用時暫停寫入 I/O 作業,此程序可能會造成該寫入 I/O 資料的遺失。

對隔離的磁碟區執行一致性檢查
  1. 停止讓任何應用程式使用磁碟區。

  2. 將磁碟區從執行個體分離。如需詳細資訊,請參閱 將 Amazon EBS 磁碟區與 Linux 執行個體分開

  3. 啟用磁碟區的 I/O。使用下列其中一種方法。

    Console
    1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

    2. 在導覽窗格中,選擇 Events (事件)。

    3. 選取您在上一個步驟中分離的磁碟區。

    4. 選擇 Actions (動作)、Enable I/O (啟用 I/O)。

    AWS CLI
    使用命令列來啟用磁碟區的 I/O

    若要檢視 Amazon EBS 磁碟區的事件資訊,您可以使用以下任一命令。如需關於這些命令列介面的詳細資訊,請參閱 存取 Amazon EC2

  4. 將磁碟區連接至另一個執行個體。如需詳細資訊,請參閱 啟動您的執行個體將 Amazon EBS 磁碟區連接至執行個體

  5. 檢查磁碟區上的資料。

    1. 執行 fsck 命令。

    2. (選用) 檢閱任何可用的應用程式或系統日誌,以取得相關的錯誤訊息。

    3. 如果磁碟區已受損超過 20 分鐘,您可以聯絡 AWS 支援中心。選擇 Troubleshoot (故障診斷),然後在故障診斷對話方塊中選擇 Contact Support (聯絡支援),以提交支援案例。

選項 3:刪除您不再需要的磁碟區

如果您想要將環境中的磁碟區移除,只要將其移除即可。如需刪除磁碟區的資訊,請參閱刪除 Amazon EBS 磁碟區

如果您有最近的快照,其備份了磁碟區上的資料,則您可以從該快照建立新的磁碟區。如需詳細資訊,請參閱 從快照建立磁碟區

使用 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性

當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O。這會導致磁碟區狀態檢查未通過,並建立磁碟區狀態事件以指出導致未通過的原因。如果您不關切特定磁碟區的一致性,並傾向在磁碟區受損時立即供使用者使用,您可以將磁碟區設為自動啟用 I/O,以覆寫預設行為。如果您啟用 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO),磁碟區和執行個體之間的 I/O 就會自動重新啟用,並且磁碟區的狀態檢查將通過。除此之外,還會顯示一則事件,通知您磁碟區的狀態具有潛在不一致性,但已自動啟用 I/O。發生此事件時,您應該檢查磁碟區的一致性並視需要將其取代。如需詳細資訊,請參閱 EBS 磁碟區事件

您可以使用下列其中一種方法來檢視及修改磁碟區的 Auto-Enabled IO (自動啟用 IO) 屬性。

New console
檢視磁碟區的 Auto-Enabled IO (自動啟用 IO) 屬性
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Volumes (磁碟區)。

  3. 選取磁碟區,並選取 Status checks (狀態檢查) 索引標籤。

    Auto-enabled IO (自動啟用 IO) 欄位會顯示所選磁碟區的目前設定 Enabled (已啟用) 或 Disabled (已停用))。

修改磁碟區的 Auto-Enabled IO (自動啟用 IO) 屬性
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Volumes (磁碟區)。

  3. 選取磁碟區,並選取 Actions (動作)、Manage Auto-enabled I/O (管理自動啟用 I/O)。

  4. 若要對受損磁碟區自動啟用 I/O,請選取 Auto-enable I/O for impaired volumes (對受損磁碟區自動啟用 IO) 核取方塊。若要停用這項功能,請清除核取方塊。

  5. 選擇 Update (更新)。

AWS CLI
檢視磁碟區的 autoEnableIO 屬性

請使用下列其中一個命令。

修改磁碟區的 autoEnableIO 屬性

請使用下列其中一個命令。

如需關於這些命令列介面的詳細資訊,請參閱 存取 Amazon EC2