Uso di pcluster update-cluster - AWS ParallelCluster

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Uso di pcluster update-cluster

In AWS ParallelCluster 3.x, pcluster update-cluster analizza le impostazioni utilizzate per creare il cluster corrente e le impostazioni nel file di configurazione per individuare eventuali problemi. Se vengono rilevati problemi, questi vengono segnalati e vengono visualizzati i passaggi da eseguire per risolverli. Ad esempio, se l'elaborazione InstanceTypeviene modificata, è necessario interrompere la flotta di elaborazione prima di procedere con l'aggiornamento. Questo problema viene segnalato quando viene scoperto. Se non vengono rilevati problemi di blocco, viene avviato il processo di aggiornamento e le modifiche vengono segnalate.

È possibile utilizzarli pcluster update-cluster --dryrun option per visualizzare le modifiche prima della loro esecuzione. Per ulteriori informazioni, consulta Esempi di pcluster update-cluster.

Per una guida alla risoluzione dei problemi, vedereAWS ParallelCluster risoluzione dei problemi.

Politica di aggiornamento: definizioni

Politica di aggiornamento: questa impostazione può essere modificata durante un aggiornamento.

Dopo aver modificato questa impostazione, il cluster può essere aggiornato utilizzandopcluster update-cluster.

Politica di aggiornamento: se questa impostazione viene modificata, l'aggiornamento non è consentito.

Dopo aver modificato questa impostazione, il cluster non può essere aggiornato. È necessario ripristinare le impostazioni per il cluster originale e creare un nuovo cluster con le impostazioni aggiornate. È possibile eliminare il cluster originale in un secondo momento. Per creare il nuovo cluster, usapcluster create-cluster. Per eliminare il cluster originale, utilizzarepcluster delete-cluster.

Politica di aggiornamento: questa impostazione non viene analizzata durante un aggiornamento.

Queste impostazioni possono essere modificate e il cluster può essere aggiornato utilizzandopcluster update-cluster.

Politica di aggiornamento: la flotta di elaborazione deve essere interrotta affinché questa impostazione possa essere modificata per un aggiornamento.

Queste impostazioni non possono essere modificate mentre esiste la flotta di elaborazione. La modifica deve essere annullata o la flotta di elaborazione deve essere interrotta (in uso). pcluster update-compute-fleet Dopo l'arresto del parco di elaborazione, puoi aggiornare il cluster (pcluster update-cluster) per attivare le modifiche. Ad esempio, se si utilizza uno Slurm scheduler con SlurmQueues/- ComputeResourcesName/MinCount> 0, viene avviato un parco di elaborazione.

Politica di aggiornamento: la flotta di elaborazione e i nodi di accesso devono essere interrotti affinché questa impostazione venga modificata per un aggiornamento.

Queste impostazioni non possono essere modificate mentre esiste il parco di elaborazione o se i nodi di accesso sono in uso. La modifica deve essere annullata oppure il parco di elaborazione e i nodi di accesso devono essere interrotti (è possibile interrompere l'utilizzo del parco di elaborazione). pcluster update-compute-fleet Dopo aver interrotto il parco di elaborazione e i nodi di accesso, puoi aggiornare il cluster (pcluster update-cluster) per attivare le modifiche.

Politica di aggiornamento: questa impostazione non può essere ridotta durante un aggiornamento.

Queste impostazioni possono essere modificate, ma non possono essere ridotte. Se è necessario ridurre queste impostazioni, è necessario ripristinare le impostazioni per il cluster originale e creare un nuovo cluster con le impostazioni aggiornate. È possibile eliminare il cluster originale in un secondo momento. Per creare il nuovo cluster, usapcluster create-cluster. Per eliminare il cluster originale, utilizzarepcluster delete-cluster.

Politica di aggiornamento: se questa impostazione viene modificata, l'aggiornamento non è consentito. Se si forza l'aggiornamento, il nuovo valore verrà ignorato e verrà utilizzato il vecchio valore.

Dopo aver modificato questa impostazione, il cluster non può essere aggiornato. È necessario ripristinare le impostazioni per il cluster originale e creare un nuovo cluster con le impostazioni aggiornate. È possibile eliminare il cluster originale in un secondo momento. Per creare il nuovo cluster, usapcluster create-cluster. Per eliminare il cluster originale, utilizzarepcluster delete-cluster.

Politica di aggiornamento: la flotta di elaborazione deve essere interrotta o QueueUpdateStrategydeve essere impostata affinché questa impostazione venga modificata per un aggiornamento.

Queste impostazioni possono essere modificate. La flotta di elaborazione deve essere interrotta (in usopcluster update-compute-fleet) o QueueUpdateStrategydeve essere impostata. Dopo l'arresto o QueueUpdateStrategyl'impostazione del parco di elaborazione, puoi aggiornare il cluster (pcluster update-cluster) per attivare le modifiche.

Nota

Questa politica di aggiornamento è supportata a partire dalla AWS ParallelCluster versione 3.2.0.

Politica di aggiornamento: per questa impostazione dei valori dell'elenco, è possibile aggiungere un nuovo valore durante un aggiornamento oppure è necessario interrompere il parco di elaborazione quando si rimuove un valore esistente.

Un nuovo valore per queste impostazioni può essere aggiunto durante un aggiornamento. Dopo aver aggiunto un nuovo valore all'elenco, il cluster può essere aggiornato utilizzando (pcluster update-cluster).

Per rimuovere un valore esistente dall'elenco, è necessario interrompere (utilizzandopcluster update-compute-fleet) il parco di calcolo.

Ad esempio, se utilizzi uno Slurm scheduler e aggiungi un nuovo tipo di istanza a Instances/ InstanceType, puoi aggiornare il cluster senza interrompere il parco di calcolo. Per rimuovere un tipo di istanza esistente da Instances/ InstanceType, è necessario prima arrestare il parco di calcolo (utilizzando pcluster). update-compute-fleet

Nota

Questa politica di aggiornamento è supportata a partire dalla versione 3.2.0. AWS ParallelCluster

Politica di aggiornamento: la riduzione delle dimensioni di una coda richiede l'arresto della flotta di elaborazione o QueueUpdateStrategydeve essere impostata su TERMINATE affinché questa impostazione venga modificata per un aggiornamento.

Queste impostazioni possono essere modificate, ma se la modifica ridurrebbe le dimensioni della coda, la flotta di elaborazione deve essere interrotta (usando pcluster update-compute-fleet) o QueueUpdateStrategydeve essere impostata su TERMINATE. Dopo che la flotta di elaborazione è stata interrotta o QueueUpdateStrategyè stata impostata su TERMINATE, puoi aggiornare il cluster (pcluster update-cluster) per attivare le modifiche.

Il comando TERMINATE impostato durante il ridimensionamento della capacità del cluster interromperà solo i nodi dalla parte posteriore dell'elenco dei nodi e lascerà intatti tutti gli altri nodi della stessa partizione.

Ad esempio, se la capacità iniziale del cluster è e, i nodi sono. MinCount = 5 MaxCount = 10 st-[1-5]; dy-[1-5] Quando si ridimensiona il cluster in MinCount = 3 eMaxCount = 5, la nuova capacità del cluster sarà composta dai nodist-[1-3]; dy-[1-2], che non verranno toccati durante l'aggiornamento. Solo i nodi st-[4-5]; dy-[3-5] verranno terminati durante l'aggiornamento.

Le seguenti modifiche sono supportate e non richiedono l'arresto del parco di elaborazione né l'QueueUpdateStrategyimpostazione su TERMINATE:

  • Ne è stata aggiunta una nuova SlurmQueue

  • ComputeResourceViene aggiunto un nuovo

  • MaxCountè aumentato

  • MinCountè aumentato ed MaxCountè aumentato almeno dello stesso importo

    Nota: questa politica di aggiornamento è supportata a partire dalla AWS ParallelCluster versione 3.9.0.

Politica di aggiornamento: per questa impostazione dei valori dell'elenco, la flotta di elaborazione deve essere interrotta o QueueUpdateStrategydeve essere impostata per aggiungere un nuovo valore; la flotta di elaborazione deve essere interrotta quando si rimuove un valore esistente.

Un nuovo valore per queste impostazioni può essere aggiunto durante un aggiornamento. La flotta di elaborazione deve essere interrotta (in usopcluster update-compute-fleet) o QueueUpdateStrategydeve essere impostata. Dopo l'arresto o QueueUpdateStrategyl'impostazione del parco di elaborazione, puoi aggiornare il cluster (pcluster update-cluster) per attivare le modifiche.

Per rimuovere un valore esistente dall'elenco, è necessario interrompere (utilizzarepcluster update-compute-fleet) il parco di calcolo.

Nota

Questa politica di aggiornamento è supportata a partire dalla AWS ParallelCluster versione 3.3.0.

Politica di aggiornamento: tutti i nodi di calcolo devono essere interrotti per l'eliminazione di un gruppo di posizionamento gestito. La flotta di elaborazione deve essere interrotta o QueueUpdateStrategydeve essere impostata affinché questa impostazione venga modificata per un aggiornamento.

La flotta di elaborazione deve essere interrotta (utilizzatapcluster update-compute-fleet) per rimuovere un gruppo di collocamento gestito. Se esegui un aggiornamento del cluster per rimuovere un gruppo di collocamento gestito prima di interrompere il parco di calcolo, viene restituito un messaggio di configurazione non valido e l'aggiornamento non procede. L'arresto del parco di elaborazione garantisce che nessuna istanza sia in esecuzione.

Esempi di pcluster update-cluster

Queste impostazioni possono essere modificate, ma se la modifica ridurrebbe la dimensione della coda, la flotta di elaborazione deve essere interrotta (usando pcluster update-compute-fleet) o QueueUpdateStrategydeve essere impostata su TERMINATE. Dopo che la flotta di elaborazione è stata interrotta o QueueUpdateStrategyè stata impostata su TERMINATE, puoi aggiornare il cluster (pcluster update-cluster) per attivare le modifiche.

  • Questo esempio dimostra un aggiornamento con alcune modifiche consentite e l'aggiornamento viene avviato direttamente.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "cluster": { "clusterName": cluster_name, "cloudformationStackStatus": "UPDATE_IN_PROGRESS", "cloudformationStackArn": stack_arn, "region": "us-east-1", "version": "3.7.0", "clusterStatus": "UPDATE_IN_PROGRESS" }, "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • Questo esempio dimostra un aggiornamento dryrun con alcune modifiche consentite. Dryrun è utile per segnalare il set di modifiche senza avviare l'aggiornamento.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 --dryrun true { "message": "Request would have succeeded, but DryRun flag is set.", "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • Questo esempio dimostra un aggiornamento con alcune modifiche che bloccano l'aggiornamento.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "message": "Update failure", "updateValidationErrors": [ { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "message": "Update actions are not currently supported for the 'KeyName' parameter. Restore 'KeyName' value to 'jenkinsjun'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "message": "All compute nodes must be stopped. Stop the compute fleet with the pcluster update-compute-fleet command", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "message": "Update actions are not currently supported for the 'MountDir' parameter. Restore 'MountDir' value to '/shared'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "/shared" } ], "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] }, { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "currentValue": "/shared" } ] }