Historial de documentos - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Historial de documentos

En la siguiente tabla se describen las principales actualizaciones y nuevas características de la Guía del usuario de AWS ParallelCluster. Actualizamos la documentación con frecuencia para dar cuenta de los comentarios que nos envía.

CambioDescripciónFecha

AWS ParallelClusterLanzamiento de la versión 3.5.0

AWS ParallelClusterSe ha publicado la versión 3.5.0

Mejoras:

  • Acceda y administre los clústeres con la AWS ParallelClusterinterfaz de usuario.

  • AgregueAWS ParallelCluster políticas versionadas en una CloudFormation plantilla a la que pueda hacer referencia en sus cargas de trabajo.

  • Agrega una biblioteca deAWS ParallelCluster Python que puedas usar con tu propio código.

  • Añada el registro de la salida de la consola del nodo de procesamiento a Amazon CloudWatch en caso de error de arranque del nodo de procesamiento.

  • Agregue un campo de errores que contenga el código de error y el motivo de ladescribe-cluster salida cuando se produce un error en la creación del clúster.

  • Agregue validadores para evitar la inyección de cadenas malintencionadas al llamar al módulo de subproceso.

  • No se puede crear el clúster si el estado del clúster cambia aPROTECTED mientras se aprovisionan nodos estáticos.

Cambios:

  • Actualización a laSlurm versión22.05.8 (desde la versión22.05.7)

  • Actualice el instalador de EFA a1.21.0.

    • EFA-Driver:efa-2.1.1-1 (desdeefa-2.1)

    • EFA-config:efa-config-1.12-1 (de efa-config-1.11-1)

    • Perfil de la EFA:efa-profile-1.5-1 (sin cambios)

    • libFabric-AWS:libfabric-aws-1.16.1amzn3.0-1 (delibfabric-aws-1.16.1)

    • RDMA-Core:rdma-core-43.0-1 (desderdma-core-43.0-2)

    • Abrir MPI:openmpi40-aws-4.1.4-3 (sin cambios)

  • Haga que los registrosSlurm del controlador sean más detallados y habilite el registro adicional para el complementoSlurm de ahorro de energía.

Correcciones de errores:

  • Corrija la creación de bases de datos de clústeres comprobando que el nombre del clúster no tenga más de 40 caracteres cuando laSlurm contabilidad esté habilitada.

  • Se solucionó un problemaclustermgtd que provocaba que los nodos de procesamiento reiniciados seSlurm reemplazaran si fallaban las comprobaciones del estado de la instancia de EC2.

  • Se solucionó un problema que impedía que los nodos de procesamiento, con reservas de capacidad compartidas por otras cuentas, se iniciaran debido a una política de IAM incorrecta en el nodo principal.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos de aws-parallelcluster y los aws-parallelcluster-uipaquetes de aws-parallelcluster GitHub. aws-parallelcluster-cookbookaws-parallelcluster-node

20 de febrero de 2023

AWS ParallelClusterLanzamiento de la versión 3.4.1

AWS ParallelClusterSe ha publicado la versión 3.4.1

Correcciones de errores:

  • Soluciona un problema delSlurm programador que podía provocar la aplicación incorrecta de las actualizaciones a su registro interno de nodos de procesamiento. Como resultado de este problema, las instancias de EC2 podrían dejar de estar disponibles o estar respaldadas por un tipo de instancia incorrecto.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

13 de enero de 2023

AWS ParallelClusterLanzamiento de la versión 3.4.0

AWS ParallelClusterSe ha publicado la versión 3.4.0

Mejoras:

  • Añada soporte para lanzar nodos en varias zonas de disponibilidad a fin de aumentar la disponibilidad de la capacidad.

  • Añada soporte para especificar varias subredes para cada cola a fin de aumentar la disponibilidad de capacidad.

  • Agregue un nuevo parámetro de configuración en Iam/ResourcePrefixpara especificar un prefijo para la ruta y el nombre de los recursos de IAM creados porAWS ParallelCluster.

  • Agregue una nueva sección de configuración DeploymentSettings/LambdaFunctionsVpcConfigpara especificar la configuración de Vpc utilizada por las funciones deAWS ParallelCluster Lambda.

  • Añada la posibilidad de especificar un script personalizado para que se ejecute en el nodo principal durante la actualización de un clúster. El script se puede especificar con HeadNode/CustomActions/OnNodeUpdatedcuando se usaSlurm como planificador.

Cambios:

  • Elimine la creación de destinos de montaje de Amazon EFS para los sistemas de archivos existentes.

  • Monte sistemas de archivos EFS medianteamazon-efs-utils. Los sistemas de archivos EFS se pueden montar mediante el cifrado en tránsito y un usuario autorizado de IAM.

  • Instale stunnel 5.67 en CentOS7 y Ubuntu para admitir el cifrado EFS en tránsito.

  • Actualice el instalador de EFA a1.20.0 (desde1.18.0).

    • EFA-Driver:efa-2.1 (desdeefa-1.16.0-1)

    • EFA-Config:efa-config-1.11-1 (sin cambios)

    • Perfil de la EFA:efa-profile-1.5-1 (sin cambios)

    • libFabric-AWS:libfabric-aws-1.16.1 (delibfabric-aws-1.16.0~amzn4.0-1)

    • RDMA-Core:rdma-core-43.0-2 desde (rdma-core-41.0-2)

    • Abrir MPI:openmpi40-aws-4.1.4-3 desde (openmpi40-aws-4.1.4-2)

  • ActualizarSlurm a la versión22.05.7 (desde22.05.5).

  • Actualice Python a3.9.16 y3.7.16. (desde3.9.15 y3.7.13).

  • ConSlurm22.05.7, los nodos dinámicos enIDLE+CLOUD+COMPLETING+POWER_DOWN+NOT_RESPONDING estado no se consideran insalubres.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

22 de diciembre de 2022

AWS ParallelClusterLanzamiento de la versión 3.3.1

AWS ParallelClusterSe ha publicado la versión 3.3.1

Cambios:

  • Las AMI oficiales de losAWS ParallelCluster productos ya están disponibles tras la obsolescencia de Amazon EC2, transcurridos dos años.

  • Aumente el tamaño de la memoria de laAWS ParallelCluster API Lambda a 2048 para reducir las penalizaciones por arranque en frío y evitar los tiempos de espera.

Correcciones de errores:

  • Evite la sustitución de los sistemas de archivos FSx gestionados por Lustre y la pérdida de datos en las actualizaciones del clúster que incluyan cambios en el ID de subred de la flota de cómputos.

  • SharedStorageDeletionPolicyse aplica a las acciones de actualización del clúster.

Para obtener más información sobre los cambios, consulte elCHANGELOG archivo del paquete aws-parallelcluster en GitHub.

2 de diciembre de 2022

AWS ParallelClusterLanzamiento de la versión 2.11.9

AWS ParallelClusterLanzamiento de la versión 2.11.9.

Correcciones de errores:

  • Evite la sustitución de los sistemas de archivos FSx gestionados por Lustre y la pérdida de datos en las actualizaciones del clúster que incluyan cambios envpc_security_group_id.

Para obtener más información sobre los cambios, consulte elCHANGELOG archivo del paquete aws-parallelcluster en GitHub.

2 de diciembre de 2022

AWS ParallelClustersolo documentación hpc6id note

AWS ParallelClusteractualización solo de documentación

  • AWS ParallelClusterno admite el tipo de instancia hpc6id para la InstanceTypeconfiguración HeadNode/.

2 de diciembre de 2022

AWS ParallelClusterpublicada la versión 3.1.5

AWS ParallelClusterSe ha publicado la versión 3.1.5

Mejoras:

  • Soluciona el problema de Slurm que impedía la terminación de nodos inactivos.

  • Actualice el instalador de EFA a 1.18.0

    • Controlador EFA:efa-1.16.0-1

    • EFA-config:efa-config-1.11-1 (desdeefa-config-1.9-1)

    • Perfil de la EFA:efa-profile-1.5-1 (sin cambios)

    • libFabric-AWS:libfabric-aws-1.16.0~amzn4.0-1 (delibfabric-1.13.2).

    • RDMA-Core:rdma-core-41.0-2 (desderdma-core-37.0)

    • Abrir MPI:openmpi40-aws-4.1.4-2 (desdeopenmpi40-aws-4.1.1-2)

Cambios:

  • Agreguelambda:ListTags ylambda:UntagResource a la pila deAWS ParallelCluster APIParallelClusterUserRole utilizada para actualizar el clúster.

  • Actualice la biblioteca MPI de Intel a la versión 2021 Update 6 (a partir de la versión 2021 Update 4). Para obtener más información, consulte la actualización 6 de la Biblioteca Intel® MPI 2021.

  • Actualice el controlador NVIDIA a la versión 470.141.03 (desde 470.103.01).

  • Actualice NVIDIA Fabric Manager a la versión 470.141.03 (desde 470.103.01).

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

16 de noviembre de 2022

AWS ParallelClusterLanzamiento de la versión 2.11.8

AWS ParallelClusterLanzamiento de la versión 2.11.8.

Cambios:

  • Actualice la biblioteca MPI de Intel a la versión 2021 Update 6 (actualizada a partir de la versión 2021 Update 4). Para obtener más información, consulte la actualización 6 de la Biblioteca Intel® MPI 2021.

  • Actualice el instalador de EFA a la versión 1.19.0

    • Controlador EFA:efa-1.16.0-1

    • EFA-config:efa-config-1.11-1 (desdeefa-config-1.9-1)

    • Perfil de la EFA:efa-profile-1.5-1 (sin cambios)

    • libFabric-AWS:libfabric-aws-1.16.0-1 (delibfabric-1.13.2)

    • RDMA-Core:rdma-core-41.0-2 (desderdma-core-37.0)

    • Abrir MPI:openmpi40-aws-4.1.4-3 (desdeopenmpi40-aws-4.1.1-2)

  • Actualice el tiempo de ejecución de Python, que utilizan las funciones de Lambda en laAWS Batch integración, a python3.9.

Correcciones de errores:

  • Impida que las etiquetas de clúster se cambien durante una actualización porque no son compatibles.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del paquete aws-parallelcluster en GitHub.

14 de noviembre de 2022

AWS ParallelClusterLanzamiento de la versión 3.3.0

AWS ParallelClusterSe ha publicado la versión 3.3.0

Mejoras:

  • Agregue soporte para la configuración de asignación de instancias múltiples para un recurso de cómputo cuando se utiliceSlurm como planificador. Para obtener más información, consulte Asignación de varios tipos de instancias con Slurm.

  • Añada soporte para agregar y quitar SharedStoragemediante una actualización del clúster, mediante una configuración actualizada. Para obtener más información, consulte Almacenamiento compartido.

  • Añada nuevos parámetrosDeletionPolicy de configuración Efsy ajustes de almacenamiento FsxLustrecompartido para permitir la retención del almacenamiento.

  • Añada soporte para laSlurm contabilidad con el nuevo parámetro de configuración Scheduling/SlurmSettings/Database. Para obtener más información, consulte Slurmcontabilidad conAWS ParallelCluster.

  • Añada soporte para reservas de capacidad bajo demanda y grupos de recursos de reserva de capacidad. Para obtener más información, consulte Inicie instancias con ODCR (reservas de capacidad bajo demanda).

  • Agregue un nuevo parámetro de configuración para especificar la versión de IMDS que se admitirá en un clúster o cree una infraestructura de imágenes en las configuraciones del clúster ImdsSupport, ImdsImds/y build ImdsSupport,/.

  • Añada soporte para Networking/PlacementGroupen la SlurmQueuesComputeResourcessección /.

  • Agregue soporte para instancias con múltiples interfaces de red que estén limitadas a un solo ENI por dispositivo.

  • Mejore la validación de las redes para sistemas de archivos Amazon EFS externos comprobando el bloque CIDR en el grupo de seguridad adjunto.

  • Añada un validador para comprobar si los tipos de instancias configurados admiten grupos de ubicación.

  • Configure los subprocesos de NFS para que sean mínimos (256, máximos (8, num_cores * 4)) para garantizar una mejor estabilidad y rendimiento.

  • Mueva la instalación de NFS en el momento de la compilación para reducir el tiempo de configuración.

  • Habilite el cifrado del lado del servidor para el tema de EcrImageBuilder SNS que se crea al implementar laAWS ParallelCluster API y se usa para notificar los eventos de creación de imágenes de docker.

Cambios:

  • Cambie el comportamiento de SlurmQueues/Networking/PlacementGroup/Enabled. Ahora crea un grupo de ubicación administrado único para cada recurso de procesamiento en lugar de un solo grupo de ubicación administrado para todos los recursos de procesamiento.

  • Agregue soporte para SlurmQueues//NetworkingPlacementGroup/Namecomo método de nomenclatura preferido.

  • Mueva las etiquetas del nodo principal de la plantilla de lanzamiento a la definición de la instancia para evitar que se sustituyan los nodos principales en las actualizaciones de las etiquetas.

  • Deshabilite el subprocesamiento múltiple mediante un script ejecutado porcloud-init y no mediante elCpuOptions conjunto establecido en la plantilla de lanzamiento.

  • Actualice Python a la versión 3.9 y NodeJS a la versión 16 en la infraestructura de API, el contenedor de API Docker y los recursos del clúster Lambda.

  • Elimine la compatibilidad con Python 3.6 inaws-parallelcluster-batch-cli.

  • ActualizarSlurm a la versión22.05.5 (desde21.08.8-2).

  • Actualice el controlador NVIDIA a la versión470.141.03 (desde470.129.06).

  • Actualice NVIDIA Fabric Manager a la versión470.141.03 (desde470.129.06).

  • Actualice el kit de herramientas NVIDIA CUDA a la versión 11.7.1 (from 11.4.4).

  • Actualice Python utilizado enAWS ParallelCluster virtualenvs de3.7.13 a3.9.15.

  • Actualice el instalador de EFA a la versión 1.18.0.

    • EFA-Driver:efa-1.16.0-1 (sin cambios)

    • Configuración EFA:efa-config-1.11-1 (from efa-config-1.10-1)

    • Perfil de la EFA:efa-profile-1.5-1 (sin cambios)

    • libFabric-AWS:libfabric-aws-1.16.0~amzn4.0-1 (delibfabric-aws-1.16.0~amzn2.0-1).

    • RDMA-Core:rdma-core-41.0-2 (desderdma-core-37.0)

    • Abrir MPI:openmpi40-aws-4.1.4-2 (desdeopenmpi40-aws-4.1.1-2)

  • Actualice NICE DCV a la versión2022.1-13300 (desde2022.0-12760).

  • Habilite la supresiónSingleSubnetValidator del formularioQueues.

  • No sustituyaDRAIN los nodos cuando estén enCOMPLETING estado, ya que es posible que Epilog siga ejecutándose.

Correcciones de errores:

  • Corrige el error de validación del parámetro de filtros delAWS ParallelClusterListClusterLogStreams comando para que falle cuando se pasan filtros incorrectos.

  • Corrija la validación del parámetro SharedStorage/EfsSettingspara que falle la validación cuandoFileSystemId se especifica junto con otros EfsSettingsparámetros SharedStorage//. Anteriormente,FileSystemId no estaba incluido.

  • Corrija la actualización del clúster al cambiar el orden SharedStoragejunto con otros cambios en la configuración.

  • CorrecciónUpdateParallelClusterLambdaRole en laAWS ParallelCluster API para subir los registros CloudWatch.

  • Solucione el problema de que Cinc no utilice el paquete de certificados de CA local al instalar paquetes antes de ejecutar cualquier libro de cocina.

  • Soluciona un problema al actualizar Ubuntu conpcluster build-image cuandoBuild:UpdateOsPackages:Enabled:true está configurado.

  • Corrige el análisis de la configuración del clúster de YAML al fallar en las claves duplicadas.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

2 de noviembre de 2022

AWS ParallelClusterSe agregó solo la referencia de la API a la documentación.

AWS ParallelClusteractualización solo de documentación

27 de octubre de 2022

AWS ParallelClusterLanzamiento de la versión 3.2.1

AWS ParallelClusterSe ha publicado la versión 3.2.1.

Mejoras:

  • Mejore la lógica para asociar las tablas de enrutamiento del host a las diferentes tarjetas de red a fin de admitir mejor las instancias de EC2 con varias NIC.

Cambios:

  • Actualice el controlador NVIDIA a la versión 470.141.03.

  • Actualice NVIDIA Fabric Manager a la versión 470.141.03.

  • Desactive las tareas decron trabajoman-db ymlocate, lo que puede tener un impacto negativo en el rendimiento del nodo.

  • Actualice la biblioteca Intel MPI a 2021.6.0.602.

  • Actualice Python de la 3.7.10 a la 3.7.13 en respuesta a este riesgo de seguridad.

Correcciones de errores:

  • Evite fallarDescribeCluster cuando la configuración del clúster no esté disponible.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

3 de octubre de 2022

AWS ParallelClusterLanzamiento de la versión 3.2.0

AWS ParallelClusterSe ha publicado la versión 3.2.0.

Mejoras:

Cambios:

  • Actualice el instalador de EFA a la versión 1.17.2.

    • Controlador EFA:efa-1.16.0-1

    • Configuración EFA:efa-config-1.10-1

    • Perfil EFA:efa-profile-1.5-1

    • Libfabric:libfabric-aws-1.16.0~amzn2.0-1

    • Núcleo RDMA:rdma-core-41.0-2

    • Open MPI:openmpi40-aws-4.1.4-2

  • Actualice NICE DCV a la versión 2022.0-12760.

  • Actualice el controlador NVIDIA a la versión 470.129.06.

  • Actualice NVIDIA Fabric Manager a la versión 470.129.06.

  • Cambie los tipos de volúmenes de EBS predeterminados de gp2 a gp3 tanto en el volumen raíz como en el adicional.

  • Cambios en los sistemas de archivos FSx for Lustre creados porAWS ParallelCluster:

    • Cambie el tipo de despliegue predeterminado aScratch_2.

    • Cambie la versión del servidor Lustre a2.12.

  • No es necesario Enabledconfigurar PlacementGroup/trueal pasar unPlacementGroup/existenteId.

  • No permite configurarPlacementGroup/IdcuandoPlacementGroup/Enabledse establece explícitamente enfalse.

  • Agregue unaparallelcluster:cluster-name etiqueta a todos los recursos creados porAWS ParallelCluster.

  • Agregarlambda:ListTags ylambda:UntagResourceParallelClusterUserRole usar en la pila deAWS ParallelCluster API para actualizar el clúster.

  • Restrinja el accesoIMDS a IPv6 únicamente a los usuarios administradores de clústeres y raíz cuando el parámetro de configuraciónHeadNodeImds//Securedesté activado.

  • Con una AMI personalizada, utilice el tamaño del volumen raíz de la AMI en lugar del ParallelCluster predeterminado de 35 GiB. El valor se puede cambiar en el archivo de configuración del clúster.

  • Desactivación automática de la flota de procesamiento de datos cuando el parámetro de configuraciónScheduling/SlurmQueues/ComputeResources/SpotPricees menor que el precio mínimo requerido de cumplimiento de solicitudes de spot.

  • Muestrarequested_value loscurrent_value valores del conjunto de cambios al añadir o eliminar una sección durante una actualización.

  • Desactive elaws-ubuntu-eni-helper servicio, disponible en las AMI de Deep Learning, para evitar conflictosconfigure_nw_interface.sh al configurar instancias con varias tarjetas de red.

  • Elimine la compatibilidad con Python 3.6.

  • Configure MTU en 9001 para todas las interfaces de red al configurar instancias con varias tarjetas de red.

  • Elimine el punto final al configurar el FQDN del nodo de procesamiento.

  • Administre los nodos estáticos enPOWERING_DOWN.

  • No reemplaza el nodo dinámico,POWER_DOWN ya que es posible que los trabajos aún estén ejecutándose.

  • El reinicioclustermgtd y losslurmctld daemons en el momento de la actualización del clúster solo cuandoScheduling los parámetros se actualicen en la configuración del clúster.

  • Archivosslurmctld de actualización yslurmdsystemd servicio.

  • Restrinja el acceso de IPv6 al IMDS únicamente a los usuarios administradores de clústeres y raíz, cuando el parámetro de configuraciónHeadNodeImds//Securedesté activado.

  • Defina la configuración de SlurmAuthInfo=cred_expire=70 para reducir el tiempo que deben esperar los trabajos en cola antes de volver a comenzar cuando los nodos no estén disponibles.

  • Actualice las dependencias de libros de cocina de terceros:

    • apt-7.4.2 (desde apt-7.4.0)

    • línea-4.5.2 (a partir de línea-4.0.1)

    • openssh-2.10.3 (de openssh-2.9.1)

    • pyenv-3.5.1 (de pyenv-3.4.2)

    • selinux-6.0.4 (de selinux-3.1.1)

    • yum-7.4.0 (de yum-6.1.1)

    • yum-epel-4.5.0 (de yum-epel-4.1.2)

Correcciones de errores:

  • Corrija el comportamiento predeterminado para omitir los pasos deAWS ParallelCluster validación y prueba al crear una AMI personalizada.

  • Corrige la filtración del identificador de archivocomputemgtd.

  • Se corrigió la condición de carrera que provocaba que las instancias lanzadas se cancelaran inmediatamente de forma esporádica porque aún no estaban disponibles en la DescribeInstances respuesta de EC2.

  • Corrige la compatibilidad con elDisableSimultaneousMultithreading parámetro en los tipos de instancias con procesadores Arm.

  • Corrige el error de actualización de la pila deAWS ParallelCluster API al actualizar desde una versión anterior. Añada el patrón de recursos utilizado para laListImagePipelineImages acción enEcrImageDeletionLambdaRole.

  • SeAWS ParallelCluster corrigió el problema de que la API añadía los permisos faltantes necesarios para importar o exportar desde Amazon S3 al crear un sistema de archivos FSx for Lustre.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

27 de julio de 2022

AWS ParallelClusteractualizaciones solo de documentación de este año hasta la fecha

AWS ParallelClusteractualizaciones solo de documentación.

6 de julio de 2022

AWS ParallelClusterLanzamiento de la versión 3.1.4

AWS ParallelClusterSe ha publicado la versión 3.1.4.

Mejoras:

Cambios:

  • Actualice Slurm a la versión 21.08.8-2.

  • Crea Slurm con soporte de JWT.

  • No es necesario Enabledconfigurar PlacementGroup/trueal pasar unPlacementGroup/existenteId.

  • Agregarlambda:TagResource aParallelClusterUserRole utilizado por la pila de ParallelCluster API para la creación de clústeres y la creación de imágenes.

Correcciones de errores:

  • Corrige la posibilidad de exportar los registros de un clúster cuando se usa elexport-cluster-logs comando con la--filters opción.

  • Corrija el punto de entrada deAWS Batch Docker para usar un directorio/home compartido para coordinar la ejecución de trabajos en paralelo con varios nodos.

  • Restablezca la dirección del nodo al configurar el nodo estático en mal estado de slurm como inactivo para evitar tratar el nodo estático que falló con una capacidad insuficiente como un nodo con error de arranque.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

16 de mayo de 2022

AWS ParallelClusterLanzamiento de la versión 2.11.7

AWS ParallelClusterLanzamiento de la versión 2.11.7.

Cambios:

  • Actualice Slurm a la versión 20.11.9.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del paquete aws-parallelcluster en GitHub.

13 de mayo de 2022

AWS ParallelClusterLanzamiento de la versión 3.1.3

AWS ParallelClusterSe ha publicado la versión 3.1.3

Mejoras:

  • Ejecute la creación de claves SSH junto con la creación del directorio HOME, por ejemplo, durante el inicio de sesión con SSH, al cambiar a otro usuario y al ejecutar un comando como otro usuario.

  • Añada compatibilidad con nombres distintivos de FQDN y LDAP en el parámetro de configuración DirectoryService/DomainName. El nuevo validador ahora comprueba ambas sintaxis.

  • El nuevoupdate_directory_service_password.sh script implementado en el nodo principal admite la actualización manual de la contraseña de Active Directory en la configuración SSSD. La contraseña la recupera elAWS Secrets Manager as de la configuración del clúster.

  • Añada soporte para implementar la infraestructura de API en entornos sin una VPC predeterminada.

Cambios:

  • Desactive los estados C más profundos en las AMI oficiales de x86_64 y en las AMI creadas mediantebuild-image comandos, para garantizar un alto rendimiento y una baja latencia.

  • Actualizaciones de paquetes del sistema operativo y correcciones de seguridad.

  • Cambie las imágenes base de Amazon Linux 2 para usar AMI con Kernel 5.10.

Correcciones de errores:

  • Se corrige la pila de imágenesDELETE_FAILED de compilación después de que la imagen se haya creado correctamente, debido a las nuevas políticas de EC2 Image Builder.

  • Corrija el parámetro de configuración DirectoryService/DomainAddrconversion a la propiedad SSSD ldap_uri cuando contiene varias direcciones de dominio.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-cookbooklos paquetes correspondientes GitHub.

20 de abril de 2022

AWS ParallelClusterLanzamiento de la versión 2.11.6

AWS ParallelClusterLanzamiento de la versión 2.11.6.

Mejoras:

  • Mejore la gestión de excepciones en caso de que falte una red.

Cambios:

  • Actualizaciones de paquetes del sistema operativo y correcciones de seguridad.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del paquete aws-parallelcluster en GitHub.

19 de abril de 2022

AWS ParallelClusterLanzamiento de la versión 3.1.2

AWS ParallelClusterSe ha publicado la versión 3.1.2

Cambios:

  • Actualiza Slurm a la versión21.08.6 (desde21.08.5).

Correcciones de errores:

  • Corrija la actualización del/etc/hosts archivo en los nodos de procesamiento cuando se implementa un clúster en subredes sin acceso a Internet.

  • Corrija el arranque de los nodos de procesamiento para que esperen a que se inicialicen las unidades efímeras antes de unirse al clúster.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del paquete aws-parallelcluster en GitHub.

2 de marzo de 2022

AWS ParallelClusterversión 2.11.5 publicada

AWS ParallelClusterLanzamiento de la versión 2.11.5.

Mejoras:

  • Añada soporte paraNEW_CHANGED_DELETED laAutoImportPolicy opción As value of FSx for Lustre.

  • Elimine el soporte para los programadores SGE y Torque.

  • Desactive ellog4j-cve-2021-44228-hotpatch servicio en Amazon Linux para evitar una posible degradación del rendimiento.

Cambios:

  • Actualice el controlador NVIDIA a la versión470.103.01 (desde470.82.01).

  • Actualice NVIDIA Fabric Manager a la versión470.103.01 (desde470.82.01).

  • Actualice la biblioteca CUDA a la versión11.4.4 (desde11.4.3).

  • Intel MPI se actualizó a la versión 2021 Update 4 (actualizada a partir de la versión 2019 Update 8). Para obtener más información, consulte la actualización 4 de la Biblioteca Intel® MPI 2021.

  • Amplíe el tiempo de espera para la creación del nodo principal a una hora.

Correcciones de errores:

  • Corrija la conexión DCV a través de los navegadores.

  • Corrija las comillas de YAML para evitar que las etiquetas personalizadas se analicen como números.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del paquete aws-parallelcluster en GitHub.

1 de marzo de 2022

AWS ParallelClusterLanzamiento de la versión 3.1.1

AWS ParallelClusterSe ha publicado la versión 3.1.1.

  • Añada soporte para entornos de clústeres de múltiples usuarios mediante la integración con los dominios de Active Directory (AD) gestionados medianteAWS Directory Service.

  • Agregue soporte para UseEc2Hostnamesen el archivo de configuración del clúster. Cuando se establece en true, utilice los nombres de host predeterminados de EC2 (por ejemplo, ip-1-2-3-4) para los nodos de procesamiento.

  • Añada soporte para la creación de clústeres en subredes sin acceso a Internet.

  • Añada soporte para varios tipos de instancias de cómputos por cola.

  • Añada soporte para la programación de GPU con Slurm en instancias ARM con tarjetas NVIDIA.

  • Añada marcas abreviadas paracluster-name (-n),region (-r),image-id (-i) ycluster-configuration/image-configuration(-c) a laAWS ParallelCluster CLI.

  • Se agregó soporte paraNEW_CHANGED_DELETED la opción FSx para el AutoImportPolicyparámetro Lustre.

  • Agregue unaparallelcluster:compute-resource-name etiqueta aLaunchTemplates los recursos de EC2 que utilizan los nodos de procesamiento.

  • Mejore los grupos de seguridad creados dentro del clúster para permitir las conexiones entrantes desde grupos de seguridad personalizados cuando se especifiquenSecurityGroups los parámetros para algunos nodos principales o colas.

  • Instale los controladores NVIDIA y la biblioteca CUDA para ARM.

Cambios:

  • Actualiza Slurm a la versión21.08.5 (desde20.11.8).

  • Actualice el complemento Slurm a la versión21.08 (desde20.11).

  • Actualice NICE DCV a la versión2021.3-11591 (desde2021.1-10851).

  • Actualice el controlador NVIDIA a la versión470.103.01 (desde470.57.02).

  • Actualice NVIDIA Fabric Manager a la versión470.103.01 (desde470.57.02).

  • Actualice CUDA a la versión11.4.4 (desde11.4.0).

  • Intel MPI se actualizó a la versión 2021 Update 4 (actualizada a partir de la versión 2019 Update 8). Para obtener más información, consulte la actualización 4 de la Biblioteca Intel® MPI 2021.

  • Actualice pMix a la versión3.2.3 (desde3.1.5).

  • Elimine la descarga de nodos de cómputos fallidos a/home/logs/compute. Los archivos de registro de los nodos de cómputos están disponibles en CloudWatch y en los registros de la consola EC2.

  • Habilite el potencial de supresiónSlurmQueues yComputeResources longitud de los validadores.

  • Inhabilite la actualización de paquetes en el momento de lanzamiento de la instancia en Amazon Linux 2.

  • Desactive los metadatos de imagen ImageBuilder mejorados de EC2 al crear imágenesAWS ParallelCluster personalizadas.

  • Configure explícitamente lacloud-init fuente de datos para que sea EC2. Esto ahorra tiempo de arranque para las plataformas Ubuntu y CentOS.

  • Utilice el nombre del recurso de cálculo en lugar del tipo de instancia en el nombre de la plantilla de lanzamiento de la flota de cómputos.

  • Redirija stderr y stdout al archivo de registro de la CLI para evitar que aparezca texto no deseado en la salida de la CLI de pcluster.

  • Mueva las recetas de configurar/instalar a libros de cocina separados que se llaman del principal. Los puntos de entrada existentes se mantienen y son compatibles con versiones anteriores.

  • Descargue las dependencias de la plataforma HPC de Intel durante el proceso de creación de la AMI para evitar el contacto con Internet durante la creación del clúster.

  • No elimine el nombre- del recurso de cómputo al configurar los nodos de Slurm.

  • No configure las GPU en Slurm cuando el controlador NVIDIA no esté instalado.

  • Corrigeecs:ListContainerInstances el permiso enBatchUserRole.

  • Corrige la exportación de registros de clústeres cuando no hay ningún prefijo especificado, previamente exportado a unNone prefijo.

  • Se corrigió el problema de que la reversión no se realizara en caso de error en la actualización del clúster.

  • Corrigeecs:ListContainerInstances el permiso enBatchUserRole.

  • Corrija elRootVolume esquema deHeadNode generando un error siKmsKeyId se especifica una no compatible.

  • Corrija las métricas faltantes de Amazon FSx para que se muestren en el CloudWatch panel de control.

  • ArreglarEfaSecurityGroupValidator. Anteriormente, podía producir errores falsos cuando se proporcionaban grupos de seguridad personalizados y se activaba la EFA.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

10 de febrero de 2022

AWS ParallelClusterLanzamiento de la versión 3.0.3

AWS ParallelClusterSe ha publicado la versión 3.0.3.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster y aws-parallelcluster-cookbooklos paquetes incluidos GitHub.

17 de enero de 2022

AWS ParallelClusterversión 2.11.4 publicada

AWS ParallelClusterLanzamiento de la versión 2.11.4.

Los cambios incluyen:

  • CentOS8 soportes retirados. CentOS8 llega al final de su vida útil (EOL) el 31 de diciembre de 2021.

  • ActualiceSlurm Workload Manager a la versión 20.11.8.

  • Actualice Cinc Client a17.2.29.

  • NICE DCV actualizado a NICE DCV 2021.2-11190. Para obtener más información, consulte el documento DCV 2021.2-11190, del 11 de octubre de 2021, en la Guía del administrador de NICE DCV.

  • Actualice el controlador NVIDIA a la versión470.82.01 (desde460.73.01).

  • Actualice la biblioteca CUDA a la versión11.4.3 (desde11.3.0).

  • Actualice NVIDIA Fabric Manager a470.82.01.

  • Inhabilite la actualización de paquetes en el momento de lanzamiento de la instancia en Amazon Linux 2.

  • Desactive la actualización de paquetesUbuntu desatendida en Amazon Linux 2.

  • Instale la versión Python 3 de los scriptsAWS CloudFormation auxiliares enCentOS 7 yUbuntu 18.04. (Ya se utilizaban en Amazon Linux 2 yUbuntu 20.04).

Las correcciones incluyen:

  • Desactive la actualización delec2_iam_role parámetro.

  • Corrija laCpuOptions configuración de la plantilla de lanzamiento paraT2 las instancias.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster aws-parallelcluster-cookbooky aws-parallelcluster-nodelos paquetes correspondientes GitHub.

20 de diciembre de 2021

AWS ParallelClusterLanzamiento de la versión 3.0.2

AWS ParallelClusterSe ha publicado la versión 3.0.2

Actualizar elElastic Fabric Adapter instalador a 1.14.1

  • Configuración de EFA:efa-config-1.9-1 (desdeefa-config-1.9)

  • Perfil EFA:efa-profile-1.5-1 (deefa-profile-1.5)

  • Módulo EFA Kernel:efa-1.14.2 (desdeefa-1.13.0)

  • Núcleo RDMA:rdma-core-37.0 (derdma-core-35)

  • Libfabric:libfabric-1.13.2 (delibfabric-1.13.0)

  • Abrir MPI:openmpi40-aws-4.1.1-2 (sin cambios)

El RDMA de GPUDirect siempre está activado si el tipo de instancia lo admite. La opción GdrSupportde configuración no tiene ningún efecto.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster aws-parallelcluster-cookbooky aws-parallelcluster-nodelos paquetes correspondientes GitHub.

5 de noviembre de 2021

AWS ParallelClusterversión 2.11.3 publicada

AWS ParallelClusterLanzamiento de la versión 2.11.3.

  • Sepcluster createami corrigió el error debido a queSon of Grid Engine las fuentes no estaban disponibles enarc.liv.ac.uk.

Actualice elElastic Fabric Adapter instalador a 1.14.1 (desde 1.13.0)

  • Configuración de EFA:efa-config-1.9-1 (desdeefa-config-1.9)

  • Perfil EFA:efa-profile-1.5-1 (sin cambios)

  • Módulo EFA Kernel:efa-1.14.2 (desdeefa-1.13.0)

  • Núcleo RDMA:rdma-core-37.0 (derdma-core-35.0amzn)

  • Libfabric:libfabric-1.13.2 (delibfabric-1.13.0amzn1.0)

  • Abrir MPI:openmpi40-aws-4.1.1-2 (sin cambios)

El RDMA de GPUDirect siempre está activado si el tipo de instancia lo admite.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster aws-parallelcluster-cookbooky aws-parallelcluster-nodelos paquetes correspondientes GitHub.

3 de noviembre de 2021

AWS ParallelClusterpublicada la versión 3.0.1

AWS ParallelClusterSe ha publicado la versión 3.0.1

Herramienta de migración de la configuración de clú

  • Los clientes ahora pueden migrar las configuraciones de sus clústeres del formato de laAWS ParallelCluster versión 2 al formato de laAWS ParallelCluster versión 3 basado en YAML. Para obtener más información, consulte pcluster3-config-converter.

El nódulo principal se puede detener

  • Tras detener la flota de procesamiento, se puede detener el nodo principal y, posteriormente, reiniciarlo mediante la consola Amazon EC2 o elAWS CLI comando stop-instances.

Región de AWSLectura predeterminada desde~/.aws/config un archivo

  • Para elpcluster comando, si noRegión de AWS se especifica en el archivo de configuración, en el entorno o en la línea de comandos, se utiliza el valor predeterminadoRegión de AWS especificado en laregion configuración de la[default] sección del~/.aws/config archivo.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster aws-parallelcluster-cookbooky aws-parallelcluster-nodelos paquetes correspondientes GitHub.

27 de octubre de 2021

AWS ParallelClusterLanzamiento de la versión 3.0.0

AWS ParallelClusterSe ha publicado la versión 3.0.0

Support para la administración de clústeres a través de Amazon API Gateway

  • Los clientes ahora pueden gestionar e implementar clústeres a través de puntos de enlace HTTP con Amazon API Gateway. Esto abre nuevas posibilidades para los flujos de trabajo guiados o basados en eventos.

    La interfaz de línea deAWS ParallelCluster comandos (CLI) también se ha rediseñado para que sea compatible con esta API e incluye una nueva opción de salida en JSON. Esta nueva funcionalidad permite a los clientes implementar capacidades básicas similares mediante la CLI.

Creación mejorada de AMI personalizada

  • Los clientes ahora tienen acceso a un proceso más sólido para crear y administrar AMI personalizadas mediante EC2 Image Builder. Las AMI personalizadas ahora se pueden administrar mediante un archivoAWS ParallelCluster de configuración independiente y se pueden crear mediante elpcluster build-image comando de la interfaz de línea deAWS ParallelCluster comandos.

Para obtener más información sobre los cambios, consulte losCHANGELOG archivos del aws-parallelcluster aws-parallelcluster-cookbooky aws-parallelcluster-nodelos paquetes correspondientes GitHub.

10 de septiembre de 2021

AWS ParallelClusterversión 2.11.2 publicada

AWS ParallelClusterLanzamiento de la versión 2.11.2.

Los cambios incluyen:

  • No instale EFA con GPUDirect RDMA (GDR) activado en el momento del arranque si EFA está instalado en la AMI base.

  • Bloquee la versión delnvidia-fabricmanager paquete para que permanezca sincronizada con la versión del controlador NVIDIA instalada porAWS ParallelCluster.

  • Slurm: Se corrigió el problema que se producía cuando el clúster se detenía y reiniciaba mientras se encendía un nodo.

  • Elastic Fabric Adapterinstalador ha actualizado el instalador a 1.13.0:

    • Configuración EFA:efa-config-1.9 (sin cambios)

    • Perfil EFA:efa-profile-1.5-1 (sin cambios)

    • Módulo EFA Kernel:efa-1.13.0 (sin cambios)

    • Núcleo RDMA:rdma-core-35.0amzn (derdma-core-32.1amzn)

    • Libfabric:libfabric-1.13.0amzn1.0 (delibfabric-1.11.2amzn1.1)

    • Abrir MPI:openmpi40-aws-4.1.1-2 (sin cambios)

  • Cuando se utiliza una AMI personalizada con un paquete EFA preinstalado, no se realizan cambios en la EFA en el momento del arranque del nodo. Se conserva el despliegue original del paquete EFA.

Para obtener más información sobre los cambios, consulte los archivos CHANGELOG del aws-parallelcluster y aws-parallelcluster-cookbooksus paquetes GitHub.

27 de agosto de 2021

AWS ParallelClusterversión 2.11.1 publicada

AWS ParallelClusterLanzamiento de la versión 2.11.1.

Los cambios incluyen:

  • Monte sistemas de archivos mediante la opción denoatime montaje para detener la grabación de la última hora de acceso cuando se lee un archivo. Esto mejora el rendimiento del sistema de archivos remoto.

  • Elastic Fabric Adapterinstalador actualizado a 1.12.3:

    • Configuración de EFA:efa-config-1.9 (desdeefa-config-1.8-1)

    • Perfil EFA:efa-profile-1.5-1 (sin cambios)

    • Módulo EFA Kernel:efa-1.13.0 (desdeefa-1.12.3)

    • Núcleo de RDMA: rdma-core-32.1amzn (sin cambios)

    • Libfabric: libfabric-1.11.2amzn1.1 (sin cambios)

    • Abrir MPI:openmpi40-aws-4.1.1-2 (sin cambios)

  • Vuelva a intentar instalar elaws-parallelcluster paquete en el nodo principal cuandoAWS Batch lo utilice como planificador.

  • Evite errores al crearSGE en un tipo de instancia con más de 31 vCPUs.

  • Se ha fijado a la versión 1.247347.6 del CloudWatch agente de Amazon para evitar los problemas observados en la versión 1.247348.0.

Para obtener más información sobre los cambios, consulte los archivos CHANGELOG del aws-parallelcluster y aws-parallelcluster-cookbooksus paquetes GitHub.

23 de julio de 2021

AWS ParallelClusterversión 2.11.0 publicada

AWS ParallelClusterLanzamiento de la versión 2.11.0.

Los cambios incluyen:

  • Se agregó soporte paraUbuntu 20.04 (ubuntu2004) y se eliminó el soporte paraUbuntu 16.04 (ubuntu1604) y Amazon Linux (alinux). Amazon Linux 2 (alinux2) sigue siendo totalmente compatible. Para obtener más información, consulte base_os.

  • Se ha eliminado el soporte para las versiones de Python inferiores a la 3.6.

  • El tamaño de volumen raíz predeterminado se aumentó a 35 gibibytes (GiB). Para obtener más información, consulte compute_root_volume_size y master_root_volume_size.

  • Elastic Fabric Adapterinstalador actualizado a 1.12.2:

    • Configuración de EFA:efa-config-1.8-1 (desdeefa-config-1.7)

    • Perfil EFA:efa-profile-1.5-1 (deefa-profile-1.4)

    • Módulo EFA Kernel:efa-1.12.3 (desdeefa-1.10.2)

    • Núcleo RDMA:rdma-core-32.1amzn (derdma-core-31.2amzn)

    • Libfabric:libfabric-1.11.2amzn1.1 (delibfabric-1.11.1amzn1.0)

    • Abrir MPI:openmpi40-aws-4.1.1-2 (desdeopenmpi40-aws-4.1.0)

  • SlurmActualizado a la versión20.11.7 (desde20.02.7).

  • Instale SSM Agent encentos7 ycentos8. (El agente SSM está preinstalado enalinux2ubuntu1804, yubuntu2004.)

  • SGE: Utilice siempre el nombre abreviado como filtro de nombre de host conqstat.

  • Utilice la versión 2 o 2 del Servicio de metadatos de instancia (IMDSv1) en lugar de la versión 2 o 2 del Servicio de metadatos de instancia (IMDSv1). Para obtener más información, consulte el tema Metadatos de instancia y datos de usuario en la guía del usuario de instancias de Linux de Amazon EC2.

  • Actualice el controlador NVIDIA a la versión460.73.01 (desde450.80.02).

  • Actualice la biblioteca CUDA a la versión11.3.0 (desde11.0).

  • Actualice NVIDIA Fabric Manager anvidia-fabricmanager-460.

  • Actualice Python utilizado enAWS ParallelCluster virtualenvs a3.7.10 (desde3.6.13).

  • Actualice Cinc Client a16.13.16.

  • Actualice las dependencias de terceros de aws-parallelcluster-cookbook:

    • apt-7.4.0(desdeapt-7.3.0).

    • iptables-8.0.0(desdeiptables-7.1.0).

    • line-4.0.1(desdeline-2.9.0).

    • openssh-2.9.1(desdeopenssh-2.8.1).

    • pyenv-3.4.2(desdepyenv-3.1.1).

    • selinux-3.1.1(desdeselinux-2.1.1).

    • ulimit-1.1.1(desdeulimit-1.0.0).

    • yum-6.1.1(desdeyum-5.1.0).

    • yum-epel-4.1.2(desdeyum-epel-3.3.0).

Para obtener más información sobre los cambios, consulte los archivos CHANGELOG del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

1 de julio de 2021

AWS ParallelClusterpublicada la versión 2.10.4

AWS ParallelClusterpublicada la versión 2.10.4.

Los cambios incluyen:

  • SlurmActualizado a la versión20.02.7 (desde20.02.4).

Para obtener más información sobre los cambios, consulte el archivo CHANGELOG del paquete aws-parallelcluster en GitHub.

15 de mayo de 2021

AWS ParallelClusterpublicada la versión 2.10.3

AWS ParallelClusterpublicada la versión 2.10.3.

Los cambios incluyen:

  • Se agregó soporte paraUbuntu 18.04 y Amazon Linux 2 en instancias deAWS Graviton basadas en ARM enAWS China yAWS GovCloud (US)Regiones de AWS.

  • Elastic Fabric Adapterinstalador actualizado a 1.11.2:

    • Configuración EFA:efa-config-1.7 (sin cambios)

    • Perfil EFA:efa-profile-1.4 (deefa-profile-1.3)

    • Módulo EFA Kernel:efa-1.10.2 (sin cambios)

    • Núcleo de RDMA: rdma-core-31.2amzn (sin cambios)

    • Libfabric: libfabric-1.11.1amzn1.0 (sin cambios)

    • Abrir MPI:openmpi40-aws-4.1.0 (sin cambios)

Para obtener más información sobre los cambios, consulte el archivo CHANGELOG del paquete aws-parallelcluster en GitHub.

18 de marzo de 2021

AWS ParallelClusterpublicada la versión 2.10.2

AWS ParallelClusterLanzamiento de la versión 2.10.2.

Los cambios incluyen:

  • Mejore la validación de la configuración del clúster para utilizar la AMI de destino del clúster al invocar la operación de la RunInstancesAPI Amazon EC2 en--dry-run modo.

  • Actualice la versión de Python utilizada en los entornosAWS ParallelCluster virtuales a la 3.6.13.

  • Correcciónsanity_check para los tipos de instancias de Arm.

  • Correcciónenable_efa cuando se usacentos8 con los tipos de instancias deSlurm Scheduler o Arm.

  • Ejecuteapt update en modo no interactivo (-y).

  • Fixencrypted_ephemeral = true conalinux2 ycentos8.

Para obtener más información sobre los cambios, consulte el archivo CHANGELOG del paquete aws-parallelcluster en GitHub.

2 de marzo de 2021

AWS ParallelClusterpublicada la versión 2.10.1

AWS ParallelClusterLanzamiento de la versión 2.10.1.

Los cambios incluyen:

  • Se agregó soporte para África (Ciudad del Cabo) (af-south-1), Europa (Milán) (me-south-1) y Medio Oriente (Baréin) (me-south-1)Regiones de AWS. En el momento del lanzamiento, el soporte está limitado de las siguientes maneras:

    • Ninguna de estas instancias admite FSx for Lustre ni las instancias de Graviton basadas en ARMRegiones de AWS.

    • AWS Batchno es compatible en África (Ciudad del Cabo).

    • Amazon EBSio2 y los tipos degp3 volumen no se admiten en África (Ciudad del Cabo) y Europa (Milán)Regiones de AWS.

  • Se agregó soporte para Amazon EBSio2 y los tipos degp3 volumen. Para obtener más información, consulte [ebs]la sección y [raid]la sección.

  • Se agregó soporte paraElastic Fabric Adapter instancias de Graviton2 basadas en ARMalinux2 en ejecuciónubuntu1804, oubuntu2004. Para obtener más información, consulte Elastic Fabric Adapter.

  • Instale las bibliotecas de rendimiento de Arm 20.2.1 en las AMI de Arm (alinux2centos8, yubuntu1804). Para obtener más información, consulte Bibliotecas de Arm Perfor.

  • Intel MPI se actualizó a la versión 2019 Update 8 (actualizada a partir de la versión 2019 Update 7). Para obtener más información, consulte la actualización 8 de la Biblioteca Intel® MPI de 2019.

  • Se eliminó la llamada a la operación de laAWS CloudFormationDescribeStacks API del punto de entrada deAWS Batch Docker para poner fin a los errores de trabajo causados por la limitación porAWS CloudFormation.

  • Se mejoraron las llamadas a la llamada de operación de laDescribeInstanceTypes API de Amazon EC2 al validar la configuración de un clúster.

  • Las imágenes de Docker de Amazon Linux 2 se extraen de Amazon ECR Public al crear la imagen de Docker para elawsbatch planificador.

  • El tipo de instancia predeterminado cambió del tipo det2.micro instancia codificado al tipo de instancia de nivel gratuito paraRegión de AWS (t2.microot3.micro, segúnRegión de AWS). Regiones de AWSque no tienen un nivel gratuito predeterminado para el tipo det3.micro instancia.

  • Elastic Fabric Adapterinstalador ha actualizado el instalador a 1.11.1:

    • Configuración de EFA:efa-config-1.7 (desdeefa-config-1.5)

    • Perfil EFA:efa-profile-1.3 (deefa-profile-1.1)

    • Módulo EFA Kernel:efa-1.10.2 (sin cambios)

    • Núcleo RDMA:rdma-core-31.2amzn (derdma-core-31.amzn0)

    • Libfabric:libfabric-1.11.1amzn1.0 (delibfabric-1.10.1amzn1.1)

    • Abrir MPI:openmpi40-aws-4.1.0 (desdeopenmpi40-aws-4.0.5)

  • Losmaster_subnet_id parámetrosvpc_settingsvpc_id, y ahora son obligatorios.

  • Elnfsd demonio del nodo principal ahora está configurado para usar al menos 8 hilos. Si hay más de 8 núcleos, utilizará tantos subprocesos como núcleos. Cuandoubuntu1604 se usa, la configuración solo cambia después de reiniciar el nodo.

  • NICE DCV actualizado a NICE DCV 2020.2-9662. Para obtener más información, consulte el documento DCV 2020.2-9662, del 4 de diciembre de 2020, en la Guía del administrador de NICE DCV.

  • Los paquetes Intel MPI y HPC paraAWS ParallelCluster provienen de Amazon S3. Ya no se extraen de los repositorios yum de Intel.

  • Se cambió elsystemd nivel de ejecución predeterminado amulti-user.target en todos los sistemas operativos durante la creación de lasAWS ParallelCluster AMI oficiales. El nivel de ejecución se establecegraphical.target en el nodo principal solo cuando el DCV está activado. Esto impide que los servicios gráficos (por ejemplox/gdm) se ejecuten cuando no son necesarios.

  • Se ha habilitado el soporte parap4d.24xlarge instancias en el nodo principal.

  • Aumente el número máximo de reintentos al registrarSlurm nodos en Amazon Route 53.

Para obtener más información sobre los cambios, consulte los archivos CHANGELOG del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

22 de diciembre de 2020

AWS ParallelClusterversión 2.10.0 publicada

AWS ParallelClusterLanzamiento de la versión 2.10.0.

Los cambios incluyen:

  • Se agregó soporte paraCentOS 8 en totalRegiones de AWS (fuera de las regiones deAWS China yAWS GovCloud (EE. UU.)). Se ha eliminado el soporte paraCentOS 6.

  • Se agregó soporte parap4d.24xlarge instancias de nodos de cómputos.

  • Se agregó soporte para NVIDIA GPUDirect RDMA en EFA mediante la nuevaenable_efa_gdr configuración.

  • Se agregó soporte para las funciones de Amazon FSx for Lustre.

    • Configure su sistema de archivos de Amazon FSx for Lustre para importar las preferencias mediante laauto_import_policy configuración.

    • Se agregó compatibilidad con los sistemas de archivos Amazon FSx for Lustre basados en discos duros mediante ladrive_cache_type configuraciónstorage_type y.

  • Se agregó un CloudWatch panel de Amazon, que incluye las métricas del nodo principal y un fácil acceso a los registros del clúster. Para obtener más información, consulte CloudWatch Panel de control de Amazon.

  • Se agregó soporte para usar un bucket de Amazon S3 existente para almacenar la información de configuración del clúster mediante lacluster_resource_bucket configuración.

  • Se ha mejorado elpcluster createami comando.

    • Se agregó un--post-install parámetro para usar un script posterior a la instalación al crear una AMI.

    • Se agregó un paso de validación por el que se produce un error al usar una AMI base creada por una versión diferente deAWS ParallelCluster.

    • Se agregó un paso de validación para fallar si el sistema operativo seleccionado es diferente del sistema operativo de la AMI base.

    • Se agregó soporte para usar una AMIAWS ParallelCluster base.

  • Se ha mejorado elpcluster update comando.

    • Latags configuración ahora se puede cambiar durante una actualización.

    • Ahora se puede cambiar el tamaño de las colas durante una actualización sin detener la flota de procesamiento

  • Se agregó un parámetro deall_or_nothing_batch configuración paraslurm_resume el script. CuandoTrue, soloslurm_resume tendrá éxito si están disponibles todas las instancias requeridas por todos los trabajos pendientes enSlurm. Para obtener más información, consulte Introducción a losall_or_nothing_batch lanzamientos en laAWS ParallelCluster Wiki de GitHub.

  • Elastic Fabric Adapterinstalador actualizado a 1.10.1:

    • Configuración de EFA:efa-config-1.5 (desdeefa-config-1.4)

    • Perfil EFA:efa-profile-1.1 (deefa-profile-1.0.0)

    • Módulo EFA Kernel:efa-1.10.2 (desdeefa-1.6.0)

    • Núcleo RDMA:rdma-core-31.amzn0 (derdma-core-28.amzn0)

    • Libfabric:libfabric-1.11.1amzn1.0 (delibfabric-1.10.1amzn1.1)

    • Abrir MPI:openmpi40-aws-4.0.5 (desdeopenmpi40-aws-4.0.3)

  • En lasAWS GovCloud (US) regiones, habilite el soporte para NICE DCV yAWS Batch.

  • En las regiones deAWS China, habilite la compatibilidad con Amazon FSx for Lustre.

  • Actualice el controlador NVIDIA a la versión 450.80.02 (desde 450.51.05).

  • Instale NVIDIA Fabric Manager para habilitar NVIDIA NVSwitch en las plataformas compatibles.

  • Se ha eliminado el valor predeterminadoRegión de AWS deus-east-1. El valor predeterminado usa este orden de búsqueda.

    • Región de AWSespecificado en-r nuestro--region argumento.

    • AWS_DEFAULT_REGIONvariable de entorno.

    • aws_region_nameconfiguración en la [aws]sección del archivo deAWS ParallelCluster configuración (el valor predeterminado es~/.parallelcluster/config).

    • regionconfiguración en la[default] sección del archivo deAWS CLI configuración (el valor predeterminado es~/aws/config).

Para obtener más información sobre los cambios, consulte los archivos CHANGELOG del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

18 de noviembre de 2020

AWS ParallelClusterpublicada la versión 2.9.0

AWS ParallelClusterSe ha publicado la versión 2.9.0

Los cambios incluyen:

  • Se agregó soporte para múltiples colas y varios tipos de instancias en la flota de procesamiento cuando se usa conSlurm Workload Manager. Cuando se utilizan colas, los grupos de Auto Scaling ya no se utilizanSlurm. Ahora se crea una zona alojada de Amazon Route 53 con el clúster y se usa para la resolución DNS de los nodos de cómputos cuando se usa elSlurm planificador. Para obtener más información, consulte Modo de cola múltiple.

  • Se agregó soporte para NICE DCV en instancias basadas enAWS Graviton basadas en ARM.

  • Se agregó soporte para deshabilitar el hipersubprocesamiento en tipos de instancias que no admiten opciones de CPU en las plantillas de lanzamiento (por ejemplo, tipos de*.metal instancias).

  • Se agregó soporte para NFS 4 para sistemas de archivos compartidos desde el nodo principal.

  • Se ha eliminado la dependencia de cfn-init al arrancar nodos de cómputos para evitar que se agotenAWS CloudFormation cuando un gran número de nodos se unen al clúster.

  • Elastic Fabric Adapterinstalador actualizado a 1.9.5:

    • Configuración de EFA:efa-config-1.4 (desdeefa-config-1.3)

    • Perfil EFA:efa-profile-1.0.0 (nuevo)

    • Módulo de kernel: efa-1.6.0 (sin cambios)

    • Núcleo de RDMA: rdma-core-28.amzn0 (sin cambios)

    • Libfabric: libfabric-1.10.1amzn1.1 (sin cambios)

    • Abrir MPI:openmpi40-aws-4.0.3 (sin cambios)

  • SlurmActualizado a la versión20.02.4 (desde19.05.5).

  • NICE DCV actualizado a NICE DCV 2020.1-9012. Para obtener más información, consulte las notas de la versión del DCV 2020.1-9012 del 24 de agosto de 2020 en la Guía del administrador de NICE DCV.

  • Al montar unidades NFS compartidas, utilice la dirección IP privada del nodo principal en lugar del nombre de host.

  • Se agregaron nuevas secuencias de registro a CloudWatch Logs:chef-clientclustermgtdcomputemgtd,slurm_resume,, yslurm_suspend.

  • Se agregó soporte para los nombres de las colas en los scripts de preinstalación y posterior a la instalación.

  • EnAWS GovCloud (US)Regiones de AWS, utilice la opción de facturación bajo demanda de Amazon DynamoDB. Para obtener más información, consulte el modo bajo demanda en la Guía para desarrolladores de Amazon DynamoDB.

Para obtener más información sobre los cambios, consulte los archivos CHANGELOG del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

11 de septiembre de 2020

AWS ParallelClusterLanzamiento de la versión 2.8.1

AWS ParallelClusterSe ha publicado la versión 2.8.1

Los cambios incluyen:

  • Desactive el bloqueo de pantalla para las sesiones de NICE DCV para evitar que los usuarios queden bloqueados.

  • Correcciónpcluster configure al incluir un tipo de instancia basado enAWS Graviton basado en ARM.

Para obtener más información sobre los cambios, consulte los archivos CHANGELOG del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

4 de agosto de 2020

AWS ParallelClusterLanzamiento de la versión 2.8.0

AWS ParallelClusterSe ha publicado la versión 2.8.0

Los cambios incluyen:

  • Se agregó soporte para instancias basadas enAWS Graviton basadas en ARM (comoA1 yC6g).

  • Se agregó soporte para las funciones de copia de seguridad automática diaria de Amazon FSx for Lustre. Para obtener más información, consulte automatic_backup_retention_days, copy_tags_to_backups, daily_automatic_backup_start_time y fsx_backup_id.

  • Se ha eliminado la dependencia de Berkshelf depcluster createami.

  • Se mejoró la robustez y la experiencia de usuario depcluster update. Para obtener más información, consulte Uso pcluster update.

  • Elastic Fabric Adapterinstalador actualizado a 1.9.4:

    • Módulo de núcleo:efa-1.6.0 (actualizado desdeefa-1.5.1)

    • Núcleo RDMA:rdma-core-28.amzn0 (actualizado desderdma-core-25.0)

    • Libfabric:libfabric-1.10.1amzn1.1 (actualizado desdelibfabric-aws-1.9.0amzn1.1)

    • Abrir MPI:openmpi40-aws-4.0.3 (sin cambios)

  • Actualice el controlador NVIDIA a la versión 440.95.01 de Tesla en la versiónCentOS 6 y a la versión 450.51.05 en todas las demás distribuciones.

  • Actualice la biblioteca CUDA a la versión 11.0 en todas las distribuciones excepto laCentOS 6.

Para obtener más información sobre los cambios, consulte los archivos CHANGELOG del aws-parallelcluster y aws-parallelcluster-nodelos paquetes correspondientes GitHub. aws-parallelcluster-cookbook

23 de julio de 2020

AWS ParallelClusterLanzamiento de la versión 2.7.0

AWS ParallelClusterSe ha publicado la versión 2.7.0

Los cambios incluyen:

19 de mayo de 2020

AWS ParallelClusterLanzamiento de la versión 2.6.1

AWS ParallelClusterSe ha publicado la versión 2.6.1

Los cambios incluyen:

17 de abril de 2020

AWS ParallelClusterLanzamiento de la versión 2.6.0

AWS ParallelClusterSe ha publicado la versión 2.6.0

Los cambios incluyen:

  • Incorpora compatibilidad con Amazon Linux 2.

  • Ahora Amazon CloudWatch Logs se usa para recopilar registros de clústeres y planificadores. Para obtener más información, consulte Integración con Amazon CloudWatch Logs.

  • Se agregó soporte para los nuevos tipos de implementación de Amazon FSx for LustreSCRATCH_2 yPERSISTENT_1. Support para FSx for Lustre en lasUbuntu versiones 18.04 yUbuntu 16.04. Para obtener más información, consulte fsx.

  • Se agregó soporte para NICE DCV elUbuntu 18.04. Para obtener más información, consulte Connect al nodo director a través de NICE DCV.

27 de febrero de 2020

AWS ParallelClusterLanzamiento de la versión 2.5.1

AWS ParallelClusterSe ha publicado la versión 2.5.1.

13 de diciembre de 2019

AWS ParallelClusterpublicada la versión 2.5.0

AWS ParallelClusterSe ha publicado la versión 2.5.0

18 de noviembre de 2019

AWS ParallelClusterpresenta soporte para Intel MPI

AWS ParallelClusterLa versión 2.4.1 presenta soporte para Intel MPI.

29 de julio de 2019

AWS ParallelClusterintroduce el soporte para EFA

AWS ParallelClusterLa versión 2.4.0 presenta la compatibilidad con Elastic Fabric Adapter (EFA).

11 de junio de 2019

AWS ParallelClusterdocumentación publicada en el sitioAWS de documentación

La documentación de AWS ParallelCluster ya está disponible en 10 idiomas y en formatos HTML y PDF.

24 de mayo de 2018