本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
检索AWS ParallelCluster UI 和AWS ParallelCluster运行时日志
了解如何检索AWS ParallelCluster UI 和AWS ParallelCluster运行时日志以进行故障排除。首先,找到相关的AWS ParallelCluster UI 和AWS ParallelCluster堆栈名称。使用堆栈名称查找安装日志组。要完成操作,请导出日志。这些日志是特定于AWS ParallelCluster运行时的。有关集群日志,请参阅检索和保留集群日志。
先决条件
-
AWS CLI已安装。
-
您拥有在 UI 所在的AWS ParallelCluster界面AWS 账户上运行AWS CLI命令的证书。
-
您可以在AWS ParallelCluster用户界面开启AWS 账户时访问亚马逊 CloudWatch 控制台。
步骤 1:定位相关堆栈的堆栈名称
在以下示例中,将红色突出显示的文本替换为实际值。
使用安装AWS ParallelCluster用户界面的AWS 区域位置列出堆栈:
$
aws cloudformation list-stacks --region
aws-region-id
请注意以下堆栈的堆栈名称:
-
在您的账户上部署AWS ParallelCluster UI 的堆栈的名称。您在安装AWS ParallelCluster UI 时输入了此名称;例如
pcluster-ui
。 -
以您输入的AWS ParallelCluster堆栈名称为前缀的堆栈;例如
pcluster-ui-ParallelClusterApi-ABCD1234EFGH
。
步骤 2:找到日志组
列出AWS ParallelCluster UI 堆栈的日志组,如以下示例所示:
$
aws cloudformation describe-stack-resources \ --region
aws-region-id
\ --stack-namepcluster-ui
\ --query "StackResources[?ResourceType == 'AWS::Logs::LogGroup' && (LogicalResourceId == 'ApiGatewayAccessLog' || LogicalResourceId == 'ParallelClusterUILambdaLogGroup')].PhysicalResourceId" \ --output text
列出AWS ParallelCluster API 堆栈的日志组,如以下示例所示:
$
aws cloudformation describe-stack-resources \ --region
aws-region-id
\ --stack-namepcluster-ui-ParallelCluster-Api-ABCD1234EFGH
\ --query "StackResources[?ResourceType == 'AWS::Logs::LogGroup' && LogicalResourceId == 'ParallelClusterFunctionLogGroup'].PhysicalResourceId" \ --output text
请记下要在下一步中使用的日志组列表。
步骤 3:导出日志
使用以下步骤收集和导出日志:
-
登录AWS Management Console,然后在AWS ParallelCluster用户界面开启时导航到亚马逊 CloudWatch
控制台。AWS 账户 -
在导航窗格中选择日志、日志见解。
-
选择上一步中列出的所有日志组。
-
选择时间范围,例如 12 小时。
-
运行以下查询:
$
fields @timestamp, @message | sort @timestamp desc | limit 10000
-
选择导出结果、下载表 (JSON)。