检索AWS ParallelCluster UI 和AWS ParallelCluster运行时日志 - AWS ParallelCluster

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

检索AWS ParallelCluster UI 和AWS ParallelCluster运行时日志

了解如何检索AWS ParallelCluster UI 和AWS ParallelCluster运行时日志以进行故障排除。首先,找到相关的AWS ParallelCluster UI 和AWS ParallelCluster堆栈名称。使用堆栈名称查找安装日志组。要完成操作,请导出日志。这些日志是特定于AWS ParallelCluster运行时的。有关集群日志,请参阅检索和保留集群日志

先决条件
  • AWS CLI已安装。

  • 您拥有在 UI 所在的AWS ParallelCluster界面AWS 账户上运行AWS CLI命令的证书。

  • 您可以在AWS ParallelCluster用户界面开启AWS 账户时访问亚马逊 CloudWatch 控制台。

步骤 1:定位相关堆栈的堆栈名称

在以下示例中,将红色突出显示的文本替换为实际值。

使用安装AWS ParallelCluster用户界面的AWS 区域位置列出堆栈:

$ aws cloudformation list-stacks --region aws-region-id

请注意以下堆栈的堆栈名称:

  • 在您的账户上部署AWS ParallelCluster UI 的堆栈的名称。您在安装AWS ParallelCluster UI 时输入了此名称;例如pcluster-ui

  • 以您输入的AWS ParallelCluster堆栈名称为前缀的堆栈;例如pcluster-ui-ParallelClusterApi-ABCD1234EFGH

步骤 2:找到日志组

列出AWS ParallelCluster UI 堆栈的日志组,如以下示例所示:

$ aws cloudformation describe-stack-resources \ --region aws-region-id \ --stack-name pcluster-ui \ --query "StackResources[?ResourceType == 'AWS::Logs::LogGroup' && (LogicalResourceId == 'ApiGatewayAccessLog' || LogicalResourceId == 'ParallelClusterUILambdaLogGroup')].PhysicalResourceId" \ --output text

列出AWS ParallelCluster API 堆栈的日志组,如以下示例所示:

$ aws cloudformation describe-stack-resources \ --region aws-region-id \ --stack-name pcluster-ui-ParallelCluster-Api-ABCD1234EFGH \ --query "StackResources[?ResourceType == 'AWS::Logs::LogGroup' && LogicalResourceId == 'ParallelClusterFunctionLogGroup'].PhysicalResourceId" \ --output text

请记下要在下一步中使用的日志组列表。

步骤 3:导出日志

使用以下步骤收集和导出日志:

  1. 登录AWS Management Console,然后在AWS ParallelCluster用户界面开启时导航到亚马逊 CloudWatch控制台。AWS 账户

  2. 在导航窗格中选择、日志见解

  3. 选择上一步中列出的所有日志组。

  4. 选择时间范围,例如 12 小时。

  5. 运行以下查询:

    $ fields @timestamp, @message | sort @timestamp desc | limit 10000
  6. 选择导出结果下载表 (JSON)