Amazon CloudWatch Logs와 통합 - AWS ParallelCluster

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon CloudWatch Logs와 통합

CloudWatch Logs에 대한 자세한 내용은 Amazon CloudWatch Logs 사용 설명서를 참조하세요. CloudWatch Logs 통합을 구성하려면 Monitoring 섹션을 참조하세요. append-config를 사용하여 CloudWatch 구성에 사용자 지정 로그를 추가하는 방법을 알아보려면 Amazon CloudWatch 사용 설명서다중 CloudWatch 에이전트 구성 파일을 참조하세요.

Amazon CloudWatch Logs 클러스터 로그

이름이 /aws/parallelcluster/cluster-name-<timestamp>인 각 클러스터에 대해 로그 그룹이 생성됩니다(예: /aws/parallelcluster/testCluster-202202050215). 각 노드의 각 로그(또는 경로에 *가 포함된 경우 로그 집합)에는 {hostname}.{instance_id}.{logIdentifier}라는 로그 스트림이 있습니다. (예: ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher.) 로그 데이터는 모든 클러스터 인스턴스에서 root로 실행되는 CloudWatch 에이전트에 의해 CloudWatch로 전송됩니다.

Amazon CloudWatch 대시보드는 클러스터가 생성될 때 생성됩니다. 이 대시보드를 사용하면 CloudWatch Logs에 저장된 로그를 검토할 수 있습니다. 자세한 내용은 아마존 CloudWatch 대시보드 항목을 참조하세요.

이 목록에는 플랫폼, 스케줄러 및 노드에 사용할 수 있는 로그 스트림의 logIdentifier 및 경로가 포함되어 있습니다.

플랫폼, 스케줄러 및 노드에 사용할 수 있는 로그 스트림
플랫폼 스케줄러 노드 로그 스트림

amazon

centos

redhat

ubuntu

awsbatch

slurm

HeadNode

dcv-authenticator: /var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

dcv-agent: /var/log/dcv/agent.*.log

dcv-xsession: /var/log/dcv/dcv-xsession.*.log

dcv-server: /var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

Xdcv: /var/log/dcv/Xdcv.*.log

cfn-init: /var/log/cfn-init.log

chef-client: /var/log/chef-client.log

amazon

centos

redhat

ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

cloud-init: /var/log/cloud-init.log

supervisord: /var/log/supervisord.log

amazon

centos

redhat

ubuntu

slurm

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

computemgtd: /var/log/parallelcluster/computemgtd

slurmd: /var/log/slurmd.log

slurm_prolog_epilog: /var/log/parallelcluster/slurm_prolog_epilog.log

amazon

centos

redhat

ubuntu

slurm

HeadNode

sssd: /var/log/sssd/sssd.log

sssd_domain_default: /var/log/sssd/sssd_default.log

pam_ssh_key_generator: /var/log/parallelcluster/pam_ssh_key_generator.log

clusterstatusmgtd: /var/log/parallelcluster/clusterstatusmgtd

clustermgtd: /var/log/parallelcluster/clustermgtd

compute_console_output: /var/log/parallelcluster/compute_console_output

slurm_resume: /var/log/parallelcluster/slurm_resume.log

slurm_suspend: /var/log/parallelcluster/slurm_suspend.log

slurmctld: /var/log/slurmctld.log

slurm_fleet_status_manager: /var/log/parallelcluster/slurm_fleet_status_manager.log

amazon

centos

redhat

awsbatch

slurm

ComputeFleet

HeadNode

system-messages: /var/log/messages

ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

syslog: /var/log/syslog

AWS Batch를 사용하는 클러스터의 작업은 RUNNING, SUCCEEDED, 또는 FAILED 상태에 도달한 작업의 출력을 CloudWatch Logs에 저장합니다. 로그 그룹은 /aws/batch/job이며 로그 스트림 이름 형식은 jobDefinitionName/default/ecs_task_id입니다. 기본적으로 이러한 로그들은 만료되도록 설정하지 않지만 유지 기간을 수정할 수 있습니다. 자세한 내용은 Amazon CloudWatch Logs User GuideCloudWatch에서 로그 데이터 보존 기간을 변경을 참조하세요.

Amazon CloudWatch Logs 빌드 이미지 로그

각 사용자 지정 빌드 이미지에 대해 이름이 /aws/imagebuilder/ParallelClusterImage-<image-id>인 로그 그룹이 생성됩니다. 이름이 {pcluster-version}/1인 고유한 로그 스트림에는 빌드 이미지 프로세스의 출력이 포함됩니다.

pcluster 이미지 명령을 사용하여 로그에 액세스할 수 있습니다. 자세한 내용은 AWS ParallelCluster AMI 사용자 지정 항목을 참조하세요.