Monitoring 區段 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Monitoring 區段

(選擇性) 指定叢集的監督設定。

Monitoring: Logs: CloudWatch: Enabled: boolean RetentionInDays: integer DeletionPolicy: string Rotation: Enabled: boolean Dashboards: CloudWatch: Enabled: boolean DetailedMonitoring: boolean Alarms: Enabled: boolean

更新原則:更新期間不會分析此設定。

Monitoring 屬性

Logs(選擇性)

叢集的記錄設定。

更新原則:如果變更此設定,則不允許更新。

CloudWatch(選擇性)

叢集的 CloudWatch 記錄檔設定。

更新原則:如果變更此設定,則不允許更新。

Enabled必填Boolean

如果true,叢集記錄會串流至 CloudWatch 記錄檔。預設值為 true

更新原則:如果變更此設定,則不允許更新。

RetentionInDays可選Integer

在記錄檔中保留記 CloudWatch 錄事件的天數。預設值為 180。支援的值為 0、1、3、5、7、14、30、60、120、150、180、365、400、545、731、1827 和 3653。值 0 將使用預設的 CloudWatch 記錄保留設定,也就是永不過期。

更新原則:您可以在更新期間變更此設定。

DeletionPolicy可選String

指出刪除叢集時是否要刪除 CloudWatch 記錄檔上的記錄事件。可能的值為 DeleteRetain。預設值為 Retain

更新原則:您可以在更新期間變更此設定。

Rotation(選擇性)

叢集的記錄輪替設定。

更新原則:如果變更此設定,則不允許更新。

Enabled必填Boolean

如果true,則會啟用記錄輪替。預設值為 true。當 AWS ParallelCluster 設定的記錄檔達到特定大小時,會旋轉該檔案並維護單一備份。如需詳細資訊,請參閱 AWS ParallelCluster配置的日誌輪替

更新原則:如果變更此設定,則不允許更新。

Dashboards(選擇性)

叢集的儀表板設定。

更新原則:您可以在更新期間變更此設定。

CloudWatch(選擇性)

叢集的 CloudWatch 儀表板設定。

更新原則:您可以在更新期間變更此設定。

Enabled必填Boolean

如果true,則會啟用 CloudWatch 儀表板。預設值為 true

更新原則:您可以在更新期間變更此設定。

DetailedMonitoring可選Boolean

如果設定為true,則會針對運算叢集 EC2 執行個體啟用詳細監控。啟用後,Amazon EC2 主控台會顯示每隔 1 分鐘監控執行個體的圖形。啟用此功能時會產生額外費用。預設值為 false

如需詳細資訊,請參閱《Amazon EC2 Linux 執行個體使用者指南》中的啟用或關閉執行個體的詳細監控

更新原則:必須停止運算叢集,才能變更此設定以進行更新。

注意

DetailedMonitoring從 AWS ParallelCluster 版本 3.6.0 開始添加。

Alarms(選擇性)

CloudWatch 叢集的警示。

更新原則:您可以在更新期間變更此設定。

Enabled(選擇性)

如果true,則會建立叢集的 CloudWatch 警示。預設值為 true

更新原則:您可以在更新期間變更此設定。

注意

從 AWS ParallelCluster 版本 3.8.0 開始,會針對「頭節點」建立下列警示:EC2 運作 Health 檢查、CPU /記憶體/磁碟使用率和複合警報包括所有其他警示。