¿Qué es el Servicio de Computación AWS Paralela? - AWS PCS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

¿Qué es el Servicio de Computación AWS Paralela?

AWS Parallel Computing Service (AWS PCS) es un servicio gestionado que facilita la ejecución y el escalado de las cargas de trabajo informáticas de alto rendimiento (HPC) y la creación de modelos científicos y de ingeniería basados en el AWS uso de Slurm. Úselo AWS PCS para crear clústeres de procesamiento que integren la mejor AWS computación, almacenamiento, redes y visualización de su clase. Ejecute simulaciones o cree modelos científicos y de ingeniería. Optimice y simplifique las operaciones de sus clústeres mediante las funciones integradas de administración y observabilidad. Permita que sus usuarios se centren en la investigación y la innovación al permitirles ejecutar sus aplicaciones y trabajos en un entorno familiar.

Conceptos clave

Un clúster AWS PCS tiene una o más colas asociadas a al menos un grupo de nodos de cómputo. Los trabajos se envían a colas y se ejecutan en EC2 instancias definidas por grupos de nodos de procesamiento. Puede utilizar estas bases para implementar HPC arquitecturas sofisticadas.

Clúster

Un clúster es un recurso para administrar recursos y ejecutar cargas de trabajo. Un clúster es un AWS PCS recurso que define un conjunto de configuraciones de procesamiento, redes, almacenamiento, identidad y programador de tareas. Para crear un clúster, especifique qué programador de tareas desea usar (actualmente Slurm), qué configuración de programador desea, qué controlador de servicios desea administrar el clúster y en qué VPC desea que se lancen los recursos del clúster. El programador acepta y programa los trabajos, y también lanza los nodos de cómputo (EC2instancias) que procesan esos trabajos.

Grupo de nodos de cómputo

Un grupo de nodos de procesamiento es un conjunto de nodos de procesamiento que se AWS PCS utiliza para ejecutar trabajos o proporcionar acceso interactivo a un clúster. Al definir un grupo de nodos de cómputo, se especifican características comunes, como los tipos de EC2 instancias de Amazon, el número mínimo y máximo de instancias, VPC las subredes de destino, Amazon Machine Image (AMI), la opción de compra y la configuración de lanzamiento personalizada. AWS PCSusa esta configuración para lanzar, administrar y terminar de manera eficiente los nodos de cómputo de un grupo de nodos de cómputo.

Queue

Cuando quieres ejecutar un trabajo en un clúster específico, lo envías a una cola determinada (también denominada partición). El trabajo permanece en la cola hasta que se AWS PCS programe su ejecución en un grupo de nodos de procesamiento. Asocia uno o más grupos de nodos de cómputo a cada cola. Se necesita una cola para programar y ejecutar los trabajos en los recursos del grupo de nodos de cómputo subyacentes mediante diversas políticas de programación ofrecidas por el programador de trabajos. Los usuarios no envían los trabajos directamente a un nodo de cómputo o a un grupo de nodos de cómputo.

Administrador de sistemas

Un administrador del sistema implementa, mantiene y opera un clúster. Pueden acceder a AWS PCS través de AWS Management Console AWS PCSAPI, y AWS SDK. Tienen acceso a clústeres específicos a través de SSH o AWS Systems Manager, donde pueden ejecutar tareas administrativas, ejecutar trabajos, administrar datos y realizar otras actividades basadas en el shell. Para obtener más información, consulte la Documentación de AWS Systems Manager.

Usuario final

El usuario final no tiene day-to-day la responsabilidad de implementar u operar un clúster. Utilizan una interfaz de terminal (por ejemploSSH) para acceder a los recursos del clúster, ejecutar tareas, administrar datos y realizar otras actividades basadas en el shell.