Uma EC2 instância no AWS PCS é encerrada e substituída após a reinicialização - AWS PCS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Uma EC2 instância no AWS PCS é encerrada e substituída após a reinicialização

Visão geral do problema

Depois que uma EC2 instância em um grupo de nós de computação é reinicializada, o AWS PCS encerra e substitui automaticamente a instância.

Por que isso acontece

AWS O PCS não suporta reinicializações de instâncias. Se uma EC2 instância for reinicializada, o AWS PCS considerará a instância não íntegra e a substituirá. Se o AWS PCS encerra e substitui continuamente suas instâncias, pode ser porque algo reinicializa suas instâncias após a inicialização. Alguns exemplos incluem reinicializações por automação na EC2 instância (como reinicialização automática após aplicação de patches), automação externa à EC2 instância (como um aplicativo de gerenciamento de rede), outro AWS serviço (como AWS Systems Manager) ou reinicialização manual por uma pessoa.

O que fazer

Você pode verificar seus slurmd registros slurmctld ou para ver se sua instância foi reinicializada. Para ter mais informações, consulte Logs do agendador no AWS PCS e Monitoramento de instâncias de AWS PCS usando a Amazon CloudWatch. O exemplo de entrada de slurmctld registro a seguir indica que a instância foi reinicializada:

[2024-09-12T06:42:50.393+00:00] validate_node_specs: Node Login-1 unexpectedly rebooted boot_time=1726123354 last response=1726123285
Reinicializando devido à aplicação de patches

Geralmente, é necessária uma reinicialização após a aplicação dos patches. Não aplique patches diretamente a uma EC2 instância que faz parte de um grupo de nós de computação do AWS PCS. Se precisar corrigir suas EC2 instâncias, você deve aplicar seus patches a uma Amazon Machine Image (AMI) atualizada e atualizar seus grupos de nós de computação para usar a AMI atualizada. EC2 As novas instâncias que o AWS PCS executa para esses grupos de nós de computação usarão a AMI atualizada (corrigida). Para obter mais informações, consulte Imagens personalizadas da Amazon Machine (AMIs) para AWS PCS.