針對叢集指標的 Amazon CloudWatch 警示 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

針對叢集指標的 Amazon CloudWatch 警示

從 3.6 AWS ParallelCluster 版開始,您可以使用 Amazon CloudWatch 警示來設定叢集,以監控主節點。一個警報會監控根磁碟區disk_used_percent。另一個警報會監控mem_used_percent度量。如需詳細資訊,請參閱 Amazon CloudWatch 使用者指南中的CloudWatch代理程式收集的指

警報的名稱如下:
  • cluster-name_DiskAlarm_HeadNode

  • cluster-name_MemAlarm_HeadNode

cluster-name

在導覽窗格中選擇 [警報],存取CloudWatch主控台中的警報。下列影像顯示叢集的磁碟使用量警示和記憶體使用量警示。

A graph of the disk usage alarm status.

A graph of the memory usage alarm status.

磁碟使用率警示處於 1 個資料點的磁碟使用率百分比大於 90% 的ALARM狀態 (在 1 分鐘的時間內)。

記憶體使用量警示處於 1 個資料點的記憶體使用率百分比大於 90% 的ALARM狀態,在 1 分鐘的時間內。

注意

AWS ParallelCluster默認情況下不配置警報操作。如需如何設定警示動作 (例如傳送通知) 的相關資訊,請參閱警示動作。如需 Amazon CloudWatch 警示的詳細資訊,請參閱 Amazon 使用CloudWatch者指南中的使用 Amazon CloudWatch 警示

如果您不想建立這些 Amazon CloudWatch 警報,請false在叢集組態中將 Monitoring/Dashboards/CloudWatch/設定Enabled為來停用警示。這也會禁用亞馬遜CloudWatch儀表板的創建。如需詳細資訊,請參閱Amazon CloudWatch 儀表

注意

如果您停用 Amazon CloudWatch 儀表板的創建,也會停用 Amazon CloudWatch disk_used_percent 和叢集的memory_used_percent警示。