監控您的磁碟區狀態
Amazon Web Services (AWS) 會自動提供您可用來監控 Amazon Elastic Block Store (Amazon EBS) 磁碟區的資料。
如需其他監控資訊,請參閱 Amazon EBS 的 Amazon CloudWatch 指標 和 適用於 Amazon EBS 的 EventBridge。
EBS 磁碟區狀態檢查
磁碟區狀態檢查可讓您更清楚了解、追蹤及管理 Amazon EBS 磁碟區資料中的潛在不一致性。這些檢查的設計旨在提供您判斷 Amazon EBS 磁碟區是否受損的資訊,並協助您控制如何處理磁碟區中的潛在不一致性。
磁碟區狀態檢查是一種自動化測試,於每 5 分鐘執行一次,並會傳回通過或失敗狀態。如果所有檢查都通過,磁碟區的狀態即為 ok
。如果檢查未通過,磁碟區的狀態即為 impaired
。如果狀態為 insufficient-data
,則磁碟區上的檢查可能仍在進行。您可以檢視磁碟區狀態檢查的結果,以找出任何受損磁碟區,並執行任何必要動作。
當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O,有助於避免資料損毀。停用 I/O 之後,下一次磁碟區狀態檢查就不會通過,且磁碟區狀態為 impaired
。除此之外,還會顯示一則事件,通知您 I/O 已停用,且您可以啟用對磁碟區的 I/O 以解決磁碟區的受損狀態。我們會等待您啟用 I/O,讓您有機會決定要繼續讓執行個體使用磁碟區,還是要先使用 fsck 這類命令執行一致性檢查再決定。
注意
磁碟區狀態是以磁碟區狀態檢查為依據,而不會反映磁碟區狀態。因此,磁碟區狀態不會指出 error
狀態中的磁碟區 (例如,當磁碟區無法接受 I/O 時。)如需磁碟區狀態的資訊,請參閱磁碟區狀態。
如果您不關切特定磁碟區的一致性,並傾向在磁碟區受損時立即供使用者使用,您可以將磁碟區設為自動啟用 I/O,以覆寫預設行為。如果您啟用 Auto-Enable IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO
),磁碟區狀態檢查即可繼續通過。除此之外,還會顯示一則事件,通知您已判定出磁碟區具有潛在不一致性,但已自動啟用 I/O。這可讓您檢查磁碟區的一致性或於日後將其取代。
I/O 效能狀態檢查會比較磁碟區的實際效能與預期效能。如果磁碟區的效能低於預期,則會提醒您。此狀態檢查僅適用於連接至執行個體的佈建 IOPS SSD (io1
和 io2
) 及一般用途 SSD (gp3
) 磁碟區。狀態檢查不適用於一般用途 SSD (gp2
)、輸送量最佳化 HDD (st1
)、冷 HDD (sc1
) 或磁性 (standard
) 磁碟區。I/O 效能狀態檢查每分鐘執行一次,並每 5 分鐘 CloudWatch 收集一次此資料。從您連接 io1
或 io2
磁碟區到執行個體的那一刻起,最多可能需要 5 分鐘的時間,才能進行狀態檢查,以報告 I/O 效能狀態。
重要
在初始化從快照還原的 Provisioned IOPS SSD 磁碟區時,磁碟區的效能可能會降到預期的 50% 以下,並導致磁碟區在 I/O Performance (I/O 效能) 狀態檢查中顯示 warning
狀態。這是預期的情況,因此在初始化 Provisioned IOPS SSD 磁碟區時,您可以忽略這些磁碟區的 warning
狀態。如需詳細資訊,請參閱 初始化 Amazon EBS 磁碟區。
下表所列的是 Amazon EBS 磁碟區的狀態。
磁碟區狀態 | I/O 已啟用狀態 | I/O 效能狀態 (僅限 io1 、io2 和 gp3 磁碟區) |
---|---|---|
|
已啟用 (I/O 已啟用或 I/O 自動啟用) |
正常 (磁碟區效能如預期) |
|
已啟用 (I/O 已啟用或 I/O 自動啟用) |
降級 (磁碟區效能低於預期) 嚴重降級 (磁碟區效能大幅低於預期) |
|
已啟用 (I/O 已啟用或 I/O 自動啟用) 已停用 (磁碟區已離線且等待復原中,或正在等待使用者啟用 I/O) |
已停滯 (磁碟區效能嚴重受損) 無法使用 (無法確定 I/O 效能,因為 I/O 已停用) |
|
已啟用 (I/O 已啟用或 I/O 自動啟用) 資料不足 |
資料不足 |
您可以使用下列方法來檢視和使用狀態檢查。
EBS 磁碟區事件
當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O。這會導致磁碟區狀態檢查未通過,並建立磁碟區狀態事件以指出導致未通過的原因。
若要自動啟用具潛在資料不一致性之磁碟區的 I/O,請變更 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO
) 的設定。如需如何變更這個屬性的詳細資訊,請參閱使用受損磁碟區。
每個事件都包括開始時間 (指出事件發生的時間) 以及持續時間 (指出磁碟區的 I/O 停用多長時間)。當磁碟區的 I/O 啟用時,事件就會新增結束時間。
磁碟區狀態事件包含下列其中一個說明:
Awaiting Action: Enable IO
-
磁碟區具有潛在的資料不一致性。會停用磁碟區的 I/O 直到您明確啟用為止。在您明確啟用 I/O 之後,事件說明會變更為 IO Enabled。
IO Enabled
-
會明確啟用這個磁碟區的 I/O 操作。
IO Auto-Enabled
-
事件發生之後,會自動啟用這個磁碟區的 I/O 操作。建議您在繼續使用資料之前,先檢查是否有資料不一致性。
Normal
-
僅適用於
io1
、io2
和gp3
磁碟區。磁碟區效能如預期。 Degraded
-
僅適用於
io1
、io2
和gp3
磁碟區。磁碟區效能低於預期。 Severely Degraded
-
僅適用於
io1
、io2
和gp3
磁碟區。磁碟區效能大幅低於預期。 Stalled
-
僅適用於
io1
、io2
和gp3
磁碟區。磁碟區效能嚴重受損。
您可以使用下列方法來檢視磁碟區的事件。
如果您有已停用 I/O 的磁碟區,請參閱使用受損磁碟區。如果您磁碟區的 I/O 效能低於正常情況,這可能是您執行之動作 (例如,在峰值使用期間建立磁碟區快照、在不支援必要 I/O 頻寬的執行個體上執行磁碟區、首次存取磁碟區的資料等) 所致的暫時性狀況。
使用受損磁碟區
在因磁碟區的資料具有潛在不一致性而導致磁碟區受損的情況下,請使用下列選項。
選項 1:對連接至執行個體的磁碟區執行一致性檢查
最簡單的選項為啟用 I/O,然後對磁碟區執行資料一致性檢查,同時磁碟區仍連接至 Amazon EC2 執行個體。
對連接的磁碟區執行一致性檢查
-
停止讓任何應用程式使用磁碟區。
-
啟用磁碟區的 I/O。使用下列其中一種方法。
-
檢查磁碟區上的資料。
-
執行 fsck 命令。
-
(選用) 檢閱任何可用的應用程式或系統日誌,以取得相關的錯誤訊息。
-
如果磁碟區已受損超過 20 分鐘,您可以聯絡 AWS 支援中心。選擇 Troubleshoot (故障診斷),然後在 Troubleshoot Status Checks (為狀態檢查進行故障診斷) 對話方塊中選擇 Contact Support (聯絡支援),以提交支援案例。
-
選項 2:對使用其他執行個體的磁碟區執行一致性檢查
請使用下列步驟來檢查生產環境外的磁碟區。
重要
若在磁碟區 I/O 停用時暫停寫入 I/O 作業,此程序可能會造成該寫入 I/O 資料的遺失。
對隔離的磁碟區執行一致性檢查
-
停止讓任何應用程式使用磁碟區。
-
將磁碟區從執行個體分離。如需詳細資訊,請參閱 將 Amazon EBS 磁碟區與 Linux 執行個體分開。
-
啟用磁碟區的 I/O。使用下列其中一種方法。
-
將磁碟區連接至另一個執行個體。如需詳細資訊,請參閱 啟動您的執行個體 和 將 Amazon EBS 磁碟區連接至執行個體。
-
檢查磁碟區上的資料。
-
執行 fsck 命令。
-
(選用) 檢閱任何可用的應用程式或系統日誌,以取得相關的錯誤訊息。
-
如果磁碟區已受損超過 20 分鐘,您可以聯絡 AWS 支援中心。選擇 Troubleshoot (故障診斷),然後在故障診斷對話方塊中選擇 Contact Support (聯絡支援),以提交支援案例。
-
選項 3:刪除您不再需要的磁碟區
如果您想要將環境中的磁碟區移除,只要將其移除即可。如需刪除磁碟區的資訊,請參閱刪除 Amazon EBS 磁碟區。
如果您有最近的快照,其備份了磁碟區上的資料,則您可以從該快照建立新的磁碟區。如需詳細資訊,請參閱 從快照建立磁碟區。
使用 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性
當 Amazon EBS 判斷磁碟區的資料具有潛在不一致性時,預設會從任何連接的 EC2 執行個體停用對磁碟區的 I/O。這會導致磁碟區狀態檢查未通過,並建立磁碟區狀態事件以指出導致未通過的原因。如果您不關切特定磁碟區的一致性,並傾向在磁碟區受損時立即供使用者使用,您可以將磁碟區設為自動啟用 I/O,以覆寫預設行為。如果您啟用 Auto-Enabled IO (自動啟用 IO) 磁碟區屬性 (API 中的 autoEnableIO
),磁碟區和執行個體之間的 I/O 就會自動重新啟用,並且磁碟區的狀態檢查將通過。除此之外,還會顯示一則事件,通知您磁碟區的狀態具有潛在不一致性,但已自動啟用 I/O。發生此事件時,您應該檢查磁碟區的一致性並視需要將其取代。如需詳細資訊,請參閱 EBS 磁碟區事件。
您可以使用下列其中一種方法來檢視及修改磁碟區的 Auto-Enabled IO (自動啟用 IO) 屬性。