Uso de pcluster update-cluster - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de pcluster update-cluster

En la AWS ParallelCluster versión 3.x, pcluster update-cluster analiza la configuración utilizada para crear el clúster actual y la configuración del archivo de configuración para detectar problemas. Si se descubre algún problema, se informa al respecto y se muestran los pasos a seguir para solucionarlo. Por ejemplo, si el InstanceType de computación se cambia, se debe detener la flota de computación para que se pueda continuar con la actualización. Este problema se notifica cuando se descubre. Si no se detecta ningún problema de bloqueo, se inicia el proceso de actualización y se informa de los cambios.

Puede utilizar el pcluster update-cluster --dryrun option para ver los cambios antes de que se ejecuten. Para obtener más información, consulte Ejemplos de pcluster update-cluster.

Para obtener ayuda sobre la solución de problemas, consulte Solución de problemas de AWS ParallelCluster.

Política de actualización: definiciones

Política de actualización: esta configuración se puede cambiar durante una actualización.

Tras cambiar esta configuración, el clúster se puede actualizar mediante pcluster update-cluster.

Política de actualización: si se cambia esta configuración, no se permite la actualización.

Tras cambiar esta configuración, el clúster no se puede actualizar. Debe revertir la configuración del clúster original y crear uno nuevo con la configuración actualizada. Puede eliminar el clúster original más adelante. Utilice la pcluster create-cluster para crear un clúster. Para eliminar el clúster original, use pcluster delete-cluster.

Política de actualización: esta configuración no se analiza durante una actualización.

Tras cambiar esta configuración, el clúster se puede actualizar mediante pcluster update-cluster.

Política de actualización: la flota de computación debe estar detenida para poder cambiar esta configuración y proceder a la actualización.

Estos ajustes no se pueden cambiar mientras exista la flota de computación. El cambio debe revertirse o la flota de computación debe detenerse (usando pcluster update-compute-fleet). Una vez detenida la flota de computación, puede actualizar el clúster (pcluster update-cluster) para activar los cambios. Por ejemplo, si utiliza un programador de Slurm con SlurmQueues/ComputeResources/-Name/MinCount > 0, se iniciará una flota de computación.

Política de actualización: la flota de cómputo y los nodos de inicio de sesión deben estar detenidos para poder cambiar esta configuración y poder actualizarse.

Esta configuración no se puede cambiar mientras exista la flota informática o si los nodos de inicio de sesión estén en uso. Se debe revertir el cambio o se deben detener la flota informática y los nodos de inicio de sesión (la flota informática se puede dejar de utilizarpcluster update-compute-fleet). Una vez que se hayan detenido la flota informática y los nodos de inicio de sesión, puede actualizar el clúster (pcluster update-cluster) para activar los cambios.

Política de actualización: esta configuración no se puede reducir durante una actualización.

Estos ajustes se pueden cambiar, pero no se pueden reducir. Debe revertir la configuración del clúster original y crear uno nuevo con la configuración actualizada. Puede eliminar el clúster original más adelante. Utilice la pcluster create-cluster para crear un clúster. Para eliminar el clúster original, use pcluster delete-cluster.

Política de actualización: si se cambia esta configuración, no se permite la actualización. Si fuerzas la actualización, se ignorará el nuevo valor y se utilizará el anterior.

Tras cambiar esta configuración, el clúster no se puede actualizar. Debe revertir la configuración del clúster original y crear uno nuevo con la configuración actualizada. Puede eliminar el clúster original más adelante. Utilice la pcluster create-cluster para crear un clúster. Para eliminar el clúster original, use pcluster delete-cluster.

Política de actualización: debe haberse detenido la flota de computación o configurado QueueUpdateStrategy para poder cambiar esta configuración y proceder a la actualización.

Estos ajustes se pueden cambiar. La flota de computación debe estar detenida (utilizando pcluster update-compute-fleet) o QueueUpdateStrategy debe configurarse. Tras detener la flota de computación o configurar QueueUpdateStrategy, puede actualizar el clúster (pcluster update-cluster) para activar los cambios.

nota

Esta política de actualización se admite a partir de la AWS ParallelCluster versión 3.2.0.

Política de actualización: para esta configuración de valores de lista, se puede añadir un nuevo valor durante una actualización o se debe detener la flota de computación al eliminar un valor existente.

Se puede añadir un nuevo valor a estos ajustes durante una actualización. Tras añadir un nuevo valor a la lista, el clúster se puede actualizar mediante (pcluster update-cluster).

Para eliminar un valor existente de la lista, se debe detener la flota de computación (utilizando pcluster update-compute-fleet).

Por ejemplo, si usa un Slurm programador y agrega un nuevo tipo de instancia a Instances/ InstanceType, puede actualizar el clúster sin detener la flota de cómputo. Para eliminar un tipo de instancia existente de Instances/ InstanceType, primero se debe detener la flota de procesamiento (mediante pcluster). update-compute-fleet

nota

Esta política de actualización se admite a partir de la versión 3.2.0. AWS ParallelCluster

Política de actualización: para reducir el tamaño de una cola, es necesario detener la flota informática o QueueUpdateStrategyconfigurarla en TERMINATE para poder cambiar esta configuración para una actualización.

Esta configuración se puede cambiar, pero si el cambio quiere reducir el tamaño de la cola, la flota de procesamiento debe detenerse (mediante pcluster update-compute-fleet) o configurarse en QueueUpdateStrategyTERMINATE. Una vez que la flota de procesamiento se detenga o QueueUpdateStrategyse establezca en TERMINATE, puede actualizar el clúster (pcluster update-cluster) para activar los cambios.

El comando TERMINATE establecido al cambiar la capacidad del clúster solo terminará los nodos del final de la lista de nodos y dejará intactos todos los demás nodos de la misma partición.

Por ejemplo, si la capacidad inicial del clúster es MinCount = 5 yMaxCount = 10, los nodos lo son. st-[1-5]; dy-[1-5] Al cambiar el tamaño del clúster a MinCount = 3 yMaxCount = 5, la nueva capacidad del clúster estará compuesta por los nodosst-[1-3]; dy-[1-2], que no se modificarán durante la actualización. Durante la actualización, solo se cerrarán los nodosst-[4-5]; dy-[3-5].

Se admiten los siguientes cambios y no es necesario detener la flota informática ni QueueUpdateStrategyconfigurarla en TERMINATE:

  • Se añade SlurmQueueuno nuevo

  • Se añade ComputeResourceuna nueva

  • MaxCountse incrementa

  • MinCountse incrementa y MaxCountse incrementa al menos en la misma cantidad

    Nota: Esta política de actualización se admite a partir de la AWS ParallelCluster versión 3.9.0.

Política de actualización: para configurar esta lista de valores, debe detenerse la flota de computación o configurarse QueueUpdateStrategy para añadir un nuevo valor; la flota de computación debe detenerse al eliminar un valor existente.

Se puede añadir un nuevo valor a estos ajustes durante una actualización. La flota de computación debe estar detenida (utilizando pcluster update-compute-fleet) o QueueUpdateStrategy debe configurarse. Tras detener la flota de computación o configurar QueueUpdateStrategy, puede actualizar el clúster (pcluster update-cluster) para activar los cambios.

Para eliminar un valor existente de la lista, se debe detener la flota de computación (utilizando pcluster update-compute-fleet).

nota

Esta política de actualización se admite a partir de la AWS ParallelCluster versión 3.3.0.

Política de actualización: todos los nodos de procesamiento deben estar detenidos para poder eliminar un grupo de ubicación administrado. Debe haberse detenido la flota de computación o configurado QueueUpdateStrategy para poder cambiar esta configuración y proceder a la actualización.

La flota de computación debe detenerse (utilizando pcluster update-compute-fleet) para eliminar un grupo de ubicaciones administradas. Si ejecuta una actualización del clúster para eliminar un grupo de ubicaciones administrado antes de detener la flota de computación, aparecerá un mensaje de configuración no válido y la actualización no se realizará. Si se detiene la flota de computación, se garantiza que no se esté ejecutando ninguna instancia.

Ejemplos de pcluster update-cluster

Esta configuración se puede cambiar, pero si el cambio quiere reducir el tamaño de la cola, la flota informática debe detenerse (mediante pcluster update-compute-fleet) o configurarse en QueueUpdateStrategyTERMINATE. Una vez que la flota de procesamiento se detenga o QueueUpdateStrategyse establezca en TERMINATE, puede actualizar el clúster (pcluster update-cluster) para activar los cambios.

  • En este ejemplo, se muestra una actualización con algunos cambios permitidos y la actualización se inicia directamente.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "cluster": { "clusterName": cluster_name, "cloudformationStackStatus": "UPDATE_IN_PROGRESS", "cloudformationStackArn": stack_arn, "region": "us-east-1", "version": "3.7.0", "clusterStatus": "UPDATE_IN_PROGRESS" }, "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • En este ejemplo, se muestra una actualización en seco con algunos cambios permitidos. Dryrun es útil para informar del conjunto de cambios sin iniciar la actualización.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 --dryrun true { "message": "Request would have succeeded, but DryRun flag is set.", "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • En este ejemplo se muestra una actualización con algunos cambios que bloquean la actualización.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "message": "Update failure", "updateValidationErrors": [ { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "message": "Update actions are not currently supported for the 'KeyName' parameter. Restore 'KeyName' value to 'jenkinsjun'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "message": "All compute nodes must be stopped. Stop the compute fleet with the pcluster update-compute-fleet command", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "message": "Update actions are not currently supported for the 'MountDir' parameter. Restore 'MountDir' value to '/shared'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "/shared" } ], "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] }, { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "currentValue": "/shared" } ] }