本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
网络排查排除
单个公有子网中的集群问题
检查cloud-init-output.log
来自其中一个计算节点的。如果您发现类似以下内容表明节点在Slurm初始化中卡住,则很可能是由于缺少 DynamoDB VPC 终端节点。添加 DynamoDB 端点。有关更多信息,请参阅 AWS ParallelCluster在无法访问互联网的单个子网中。
ruby_block[retrieve compute node info] action run[2022-03-11T17:47:11+00:00] INFO: Processing ruby_block[retrieve compute node info] action run (aws-parallelcluster-slurm::init line 31)