與 Amazon Amazon Amazon CloudWatch 的整合 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

與 Amazon Amazon Amazon CloudWatch 的整合

如需有關CloudWatch日誌的詳細資訊,請參閱 Amazon CloudWatch 日誌使用者指南。若要設定CloudWatch記錄檔整合,請參閱Monitoring章節。若要了解如何使用將自訂日誌附加到CloudWatch組態append-config,請參閱 Amazon 使用CloudWatch者指南中的多個CloudWatch代理程式組態檔案

亞馬遜CloudWatch日誌群集日誌

系統會為每個叢集建立一個名稱 /aws/parallelcluster/cluster-name-<timestamp> (例如/aws/parallelcluster/testCluster-202202050215) 的記錄群組。每個節點上的每個日誌(或一組日誌,如果路徑包含*)都有一個名為的日誌流{hostname}.{instance_id}.{logIdentifier}。(例如ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher。) 日誌資料CloudWatch由代理程式傳送至,CloudWatch代理程式會與所有叢集執root行個體一樣執行。

建立叢集時,會建立 Amazon Amazon CloudWatch 儀表板。此儀表板可讓您檢閱記錄中儲存的CloudWatch記錄。如需詳細資訊,請參閱Amazon CloudWatch 儀表

此清單包含 log Identifier 和可用於平台、排程器和節點的記錄串流路徑。

可用於平台、排程器和節點的記錄串流
平台 排程器 節點 日誌串流

amazon

CENTOS

紅帽子

ubuntu

awsbatch

泥漿

HeadNode

DCV-身份驗證器:/var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

DCV-代理:/var/log/dcv/agent.*.log

DC 交互作業階段:/var/log/dcv/dcv-xsession.*.log

DCV-服務器:/var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

XDCV:/var/log/dcv/Xdcv.*.log

cfn-init:/var/log/cfn-init.log

廚師客戶:/var/log/chef-client.log

amazon

CENTOS

紅帽子

ubuntu

awsbatch

泥漿

ComputeFleet

HeadNode

雲初始化:/var/log/cloud-init.log

監督:/var/log/supervisord.log

amazon

CENTOS

紅帽子

ubuntu

泥漿

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

計算:/var/log/parallelcluster/computemgtd

泥漿:/var/log/slurmd.log

思羅姆 _ 生理 _ 癲癇:/var/log/parallelcluster/slurm_prolog_epilog.log

amazon

CENTOS

紅帽子

ubuntu

泥漿

HeadNode

社會科學部:/var/log/sssd/sssd.log

網域預設值:/var/log/sssd/sssd_default.log

密鑰生成器:/var/log/parallelcluster/pam_ssh_key_generator.log

叢集狀態:/var/log/parallelcluster/clusterstatusmgtd

集群:/var/log/parallelcluster/clustermgtd

電腦輸出:/var/log/parallelcluster/compute_console_output

思樂簡歷:/var/log/parallelcluster/slurm_resume.log

思盧姆暫停:/var/log/parallelcluster/slurm_suspend.log

思樂麥克頂級:/var/log/slurmctld.log

思樂隊狀態管理器:/var/log/parallelcluster/slurm_fleet_status_manager.log

amazon

CENTOS

紅帽子

awsbatch

泥漿

ComputeFleet

HeadNode

系統訊息:/var/log/messages

ubuntu

awsbatch

泥漿

ComputeFleet

HeadNode

系統日誌:/var/log/syslog

叢集中使用的工作會將達到RUNNINGSUCCEEDED或狀態的工作輸出AWS Batch儲存FAILED在CloudWatch記錄檔中。記錄群組為/aws/batch/job,記錄資料流名稱格式為jobDefinitionName/default/ecs_task_id。根據預設,這些記錄檔設定為不到期,但您可以修改保留期間。如需詳細資訊,請參閱《Amazon Logs User Guide》中的變更CloudWatch日誌中的CloudWatch日誌資料保留期間。

亞馬遜CloudWatch日誌構建映像日誌

系統會為每個自訂組建映像建立一個記錄群組,名稱為/aws/imagebuilder/ParallelClusterImage-<image-id>。名稱為 {pcluster-version} /1 的唯一日誌流包含構建映像過程的輸出。

您可以使用 image 指令存取pcluster記錄檔。如需詳細資訊,請參閱 AWS ParallelCluster AMI 定制