Fehlerbehebung im Netzwerk - AWS ParallelCluster

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Fehlerbehebung im Netzwerk

Probleme mit Clustern in einem einzelnen öffentlichen Subnetz

Überprüfen Sie das cloud-init-output.log von einem der Rechenknoten aus. Wenn Sie etwas wie das Folgende finden, das darauf hindeutet, dass der Knoten bei der Slurm Initialisierung feststeckt, liegt das höchstwahrscheinlich an einem fehlenden DynamoDB-VPC-Endpunkt. Fügen Sie den DynamoDB-Endpunkt hinzu. Weitere Informationen finden Sie unter AWS ParallelCluster in einem einzigen Subnetz ohne Internetzugang.

ruby_block[retrieve compute node info] action run[2022-03-11T17:47:11+00:00] INFO: Processing ruby_block[retrieve compute node info] action run (aws-parallelcluster-slurm::init line 31)