使用 CloudWatch 指標監視彈性圖形 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 CloudWatch 指標監視彈性圖形

重要

Amazon 彈性圖形於 2024 年 1 月 8 日終止使用壽命。對於需要圖形加速的工作負載,我們建議您使用 Amazon EC2 G4ad、G4dn 或 G5 執行個體。

您可以使用 Amazon 監控彈性圖形加速器 CloudWatch,Amazon 會收集有關加速器效能的指標。這些統計資料會保存兩週的期間,以便您存取歷史資訊,並更清楚服務的執行方式。

根據預設,彈性圖形加速器會 CloudWatch 在 5 分鐘內將量度資料傳送至。

有關 Amazon 的更多信息 CloudWatch,請參閱 Amazon CloudWatch 用戶指南

Elastic Graphics 指標

AWS/ElasticGPUs 命名空間包含下列 Elastic Graphics 指標。

指標 描述

顯示卡 ConnectivityCheckFailed

回報 Elastic Graphics 加速器的連線為作用中或失敗。0 值指出連線為作用中。1 值指出連線失敗。

單位:計數

顯示卡 HealthCheckFailed

回報 Elastic Graphics 加速器是否在最後一分鐘通過運作狀態檢查。0 值指出已通過狀態檢查。值一 (1) 指出狀態檢查失敗。

單位:計數

顯示卡 MemoryUtilization

已使用的 GPU 記憶體。

單位:MiB

Elastic Graphics 維度

您可以利用下列維度來篩選 Elastic Graphics 加速器的指標資料。

維度 描述
EGPUId 依照 Elastic Graphics 加速器篩選資料。
InstanceId 依照 Elastic Graphics 加速器所連接之執行個體篩選資料。

檢視彈性圖形的 CloudWatch 指標

指標會先依服務命名空間分組,再依支援的維度分組。您可以使用下列程序檢視 Elastic Graphics 加速器的指標。

若要使用 CloudWatch 主控台檢視彈性圖形度量
  1. 請在以下位置開啟 CloudWatch 主控台。 https://console.aws.amazon.com/cloudwatch/

  2. 如有必要請變更區域。從導覽列,選取您 Elastic Graphics 加速器所在的區域。如需詳細資訊,請參閱區域與端點

  3. 在導覽窗格中,選擇 Metrics (指標)。

  4. 針對 All metrics (所有指標),選取 Elastic GraphicsElastic Graphics Metrics (Elastic Graphics 指標)

檢視 Elastic Graphics 指標 (AWS CLI)

使用下列 list-metrics 命令:

aws cloudwatch list-metrics --namespace "AWS/ElasticGPUs"

創建 CloudWatch 警報以監視彈性圖形

您可以建立 CloudWatch 警示,在警示狀態變更時傳送 Amazon SNS 訊息。警示會監看您指定期間內的單一指標,然後根據若干這樣的時段內相對於指定閾值的指標值,向 Amazon SNS 主題傳送通知。

例如,您可以建立警示來監控 Elastic Graphics 加速器的運作狀態,當圖形加速器在接連三個 5 分鐘的期間內未通過運作狀態檢查時傳送通知。

建立 Elastic Graphics 加速器運作狀態警示
  1. 請在以下位置開啟 CloudWatch 主控台。 https://console.aws.amazon.com/cloudwatch/

  2. 在導覽窗格中,選擇 Alarms (警示)、Create Alarm (建立警示)。

  3. 選擇 Select metric (選取指標)Elastic GraphicsElastic Graphics Metrics (Elastic Graphics 指標)

  4. 選取 GPU HealthCheckFailed 量度,然後選擇「選取量度」

  5. 請如下所示設定警示:

    1. 針對 Alarm details (警示詳細資訊),輸入警示的名稱和描述。針對 Whenever (每當),選擇 >= 並輸入 1

    2. 針對 Actions (動作),選取現有的通知清單,或選擇 New list (新增清單)

    3. 選擇Create Alarm (建立警示)。