Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Requisitos previos para utilizar SageMaker HyperPod
En las siguientes secciones se explican los requisitos previos antes de empezar. SageMaker HyperPod
Temas
SageMaker HyperPod cuotas
Puedes crear SageMaker HyperPod clústeres según las cuotas de uso de clústeres de tu AWS cuenta.
importante
Para obtener más información sobre SageMaker HyperPod los precios, consulte SageMaker HyperPod precios Amazon SageMaker AI Pricing
Consulta SageMaker HyperPod las cuotas de Amazon utilizando el AWS Management Console
Busca los valores predeterminados y aplicados de una cuota, también conocida como límite, para el uso del clúster, que se utiliza para SageMaker HyperPod.
-
Abra la consola de Service Quotas
. -
En el panel de navegación de la izquierda, elija Servicios de AWS .
-
En la lista de AWS servicios, busca y selecciona Amazon SageMaker AI.
-
En la lista de cuotas de servicio, puede ver el nombre de la cuota de servicio, el valor aplicado (si está disponible), la cuota AWS predeterminada y si el valor de la cuota es ajustable.
-
En la barra de búsqueda, escriba uso del clúster. Se mostrarán las cuotas de uso del clúster, las cuotas aplicadas y las cuotas predeterminadas.
Solicita un aumento de SageMaker HyperPod cuota de Amazon mediante el AWS Management Console
Aumente sus cuotas por cuenta o recurso.
-
Para aumentar la cuota de instancias para el uso del clúster, seleccione la cuota que desea aumentar.
-
Si la cuota es ajustable, puede solicitar un aumento de la cuota por cuenta o recurso en función del valor que aparezca en la columna de Capacidad de ajuste.
-
En Aumentar el valor de la cuota, introduzca el nuevo valor. El nuevo valor debe ser mayor que el valor actual.
-
Seleccione Request (Solicitar).
-
Para ver las solicitudes pendientes o resueltas recientemente en la consola, acceda a la pestaña Historial de solicitudes de la página de detalles del servicio o elija Panel en el panel de navegación. Para las solicitudes pendientes, seleccione el estado de la solicitud para abrir la recepción de solicitud. El estado inicial de una solicitud es Pendiente. Cuando el estado cambie a Cuota solicitada, verás el número de caso con AWS Support. Elija el número de caso para abrir el ticket para su solicitud.
Para obtener más información sobre cómo solicitar un aumento de cuota en general, consulte Requesting a Quota Increase en la Guía de usuario de Service Quotas de AWS .
Configuración SageMaker HyperPod con una Amazon VPC personalizada
Para configurar un SageMaker HyperPod clúster con una Amazon VPC personalizada, revise los siguientes requisitos previos.
nota
La configuración de la VPC es obligatoria para la orquestación de Amazon EKS. Para la orquestación de Slurm, la configuración de la VPC es opcional.
-
Valide la capacidad de la Elastic Network Interface (ENI) Cuenta de AWS antes de crear un SageMaker HyperPod clúster con una VPC personalizada. Amazon controla el límite de ENI EC2 y varía según Región de AWS. SageMaker HyperPod no puede solicitar automáticamente aumentos de cuota.
Para verificar su cuota de ENI actual:
-
Abra la consola de Service Quotas
. -
En la sección Administrar cuotas, usa la lista desplegable AWS Servicios para buscar VPC.
-
Elija ver las cuotas de Amazon Virtual Private Cloud (Amazon VPC).
-
Busque la cuota de servicio, las interfaces de red por región o el código
L-DF5E4CA3
de cuota.
Si su límite de ENI actual no es suficiente para las necesidades de su SageMaker HyperPod clúster, solicite un aumento de cuota. Garantizar de antemano una capacidad de ENI adecuada ayuda a evitar errores en el despliegue del clúster.
-
-
Cuando utilices una VPC personalizada para conectar un SageMaker HyperPod clúster con AWS recursos, proporciona el nombre, el ID, la subred y el grupo de seguridad de la VPC durante la IDs creación del clúster. Región de AWS IDs
nota
Cuando su Amazon VPC y sus subredes admiten IPv6 el
OverrideVPCConfig
atributoVPCConfig
de a nivel de clúster o de grupo de instanciasClusterInstanceGroupSpecification
, las comunicaciones de red varían según la plataforma de organización del clúster:-
Los clústeres organizados por SLURM configuran automáticamente los nodos con direcciones IPv6 Y IPv4 duales, lo que permite una comunicación de red inmediata. IPv6 No se requiere ninguna configuración adicional aparte de la configuración.
VPCConfig
IPv6 -
En los clústeres orquestados por EKS, los nodos reciben direcciones de doble pila, pero los pods solo se pueden usar cuando IPv6 el clúster de Amazon EKS está habilitado de forma explícita. IPv6 Debe crear un nuevo clúster de IPv6 Amazon EKS; los clústeres de IPv4 Amazon EKS existentes no se pueden convertir en IPv6. Para obtener información sobre la implementación de un clúster de IPv6 Amazon EKS, consulte Implementación de Amazon EKS IPv6 clústeres.
Recursos adicionales para la IPv6 configuración:
-
Para obtener información sobre cómo añadir IPv6 soporte a su VPC, consulte IPv6 Support for VPC.
-
Para obtener información sobre la creación de una nueva VPC IPv6 compatible, Amazon VPC consulte la Guía de creación.
-
Para configurar SageMaker HyperPod con una Amazon VPC personalizada, consulte Configuración de Amazon VPC personalizada para. SageMaker HyperPod
-
-
Asegúrese de que todos los recursos estén desplegados en el mismo lugar que Región de AWS el SageMaker HyperPod clúster. Configure las reglas del grupo de seguridad para permitir la comunicación entre recursos dentro de la VPC. Por ejemplo, al crear una VPC en
us-west-2
, aprovisione subredes en una o más zonas de disponibilidad (comous-west-2a
ous-west-2b
) y cree un grupo de seguridad que permita el tráfico intragrupo.nota
SageMaker HyperPod admite el despliegue en zonas de disponibilidad múltiple. Para obtener más información, consulte Configuración de clústeres en varios SageMaker HyperPod AZs.
-
Establezca la conectividad Amazon Simple Storage Service (Amazon S3) para los grupos de SageMaker HyperPod instancias implementados por VPC mediante la creación de un punto de enlace de VPC. Sin acceso a Internet, los grupos de instancias no pueden almacenar ni recuperar scripts del ciclo de vida, datos de entrenamiento ni artefactos de modelos. Le recomendamos que cree una política de IAM personalizada que restrinja el acceso al bucket de Amazon S3 a la VPC privada. Para obtener más información, consulte Endpoints for Amazon S3 en la Guía del usuario de Amazon VPC de AWS PrivateLink .
-
En el caso de HyperPod los clústeres que utilizan instancias habilitadas para Elastic Fabric Adapter (EFA), configure el grupo de seguridad para permitir que todo el tráfico entrante y saliente entre y hacia el propio grupo de seguridad. En concreto, evite utilizarlos
0.0.0.0/0
para reglas de salida, ya que esto podría provocar errores en las comprobaciones de estado de la EFA. Para obtener más información sobre las pautas de preparación de grupos de seguridad de EFA, consulte Paso 1: Preparar un grupo de seguridad habilitado para EFA en la Guía del usuario de Amazon EC2 .
Configuración de clústeres en varios SageMaker HyperPod AZs
Puede configurar SageMaker HyperPod los clústeres en varias zonas de disponibilidad (AZs) para mejorar la fiabilidad y la disponibilidad.
nota
El tráfico del Elastic Fabric Adapter (EFA) no puede cruzar o. AZs VPCs Esto no se aplica al tráfico de IP normal desde el dispositivo de ENA de una interfaz EFA. Para obtener más información, consulte Limitaciones del EFA.
-
Comportamiento predeterminado
HyperPod despliega todas las instancias del clúster en una única zona de disponibilidad. La configuración de la VPC determina la zona de disponibilidad de despliegue:
-
Para los clústeres orquestados por SLURM, la configuración de VPC es opcional. Cuando no se proporciona ninguna configuración de VPC, el HyperPod valor predeterminado es una subred de la VPC de la plataforma.
-
Para los clústeres orquestados por EKS, se requiere una configuración de VPC.
-
Para los orquestadores Slurm y EKS, cuando
VpcConfig
se proporciona, HyperPod selecciona una subred de la lista de subredes proporcionada.VpcConfig
Todos los grupos de instancias heredan la zona de disponibilidad de la subred.
nota
Una vez que hayas creado un clúster, no podrás modificar su
VpcConfig
configuración.Para obtener más información sobre la configuración VPCs de HyperPod los clústeres, consulte la sección anterior,Configuración SageMaker HyperPod con una Amazon VPC personalizada.
-
-
Configuración Multi-AZ
Puedes configurar tu HyperPod clúster en varios AZs al crear un clúster o al añadir un nuevo grupo de instancias a un clúster existente. Para configurar las implementaciones Multi-AZ, puedes anular la configuración de VPC predeterminada del clúster especificando diferentes subredes y grupos de seguridad, posiblemente en diferentes zonas de disponibilidad, para los grupos de instancias individuales de tu clúster.
SageMaker HyperPod Los usuarios de la API pueden usar la
OverrideVpcConfig
propiedad incluida en la o ClusterInstanceGroupSpecificationcuando trabajen con ella.CreateCluster
UpdateCluster
APIsEl
OverrideVpcConfig
campo:-
No se puede modificar después de crear el grupo de instancias.
-
Es opcional. Si no se especifica, el nivel de clúster
VpcConfig
se utiliza por defecto. -
En el caso de los clústeres orquestados por SLURM, solo se puede especificar cuando se proporciona el nivel de clúster.
VpcConfig
SiVpcConfig
se especifica no a nivel de clúster,OverrideVpcConfig
no se puede usar para ningún grupo de instancias. -
Contiene dos campos obligatorios:
-
Subnets
- acepta entre 1 y 16 subredes IDs -
SecurityGroupIds
- acepta entre 1 y 5 grupos de seguridad IDs
-
Para obtener más información sobre la creación o actualización de un SageMaker HyperPod clúster mediante la interfaz de usuario de la SageMaker HyperPod consola o AWS CLI:
-
Orquestación de Slurm: consulte Funcionamiento de clústeres orquestados por Slurm. HyperPod
-
Orquestación de EKS. Consulte Funcionamiento de clústeres orquestados por EKS. HyperPod
-
nota
Al ejecutar cargas de trabajo en varios AZs, tenga en cuenta que la comunicación de red entre AZs ellas introduce una latencia adicional. Tenga en cuenta este impacto al diseñar aplicaciones sensibles a la latencia.
Configurar AWS Systems Manager y ejecutar como para el control de acceso de los usuarios del clúster
SageMaker HyperPod DLAMIviene con AWS Systems Manager
nota
Al conceder a los usuarios el acceso a los nodos del HyperPod clúster, pueden instalar y utilizar software gestionado por los usuarios en los nodos. Asegúrese de mantener el principio de permisos con privilegios mínimos para los usuarios.
Habilitar Ejecutar como en su cuenta AWS
Como administrador de AWS cuentas o administrador de la nube, puede administrar el acceso a SageMaker HyperPod los clústeres a nivel de usuario o rol de IAM mediante la función Ejecutar como de SSM. Con esta característica, puede iniciar cada sesión de SSM con el usuario del sistema operativo asociado al usuario o rol de IAM.
Para activar la función Ejecutar como en tu AWS cuenta, sigue los pasos que se indican en Activar la compatibilidad con Ejecutar como para los nodos gestionados de Linux y macOS. Si ya ha creado usuarios de sistema operativo en su clúster, asegúrese de asociarlos a roles o usuarios de IAM etiquetándolos como se indica en la Opción 2 del paso 5 de la sección Activación del soporte Ejecutar como para nodos administrados de Linux y macOS.
(Opcional) Configuración SageMaker HyperPod con Amazon FSx for Lustre
Para empezar a usar SageMaker HyperPod y mapear las rutas de datos entre el clúster y su sistema de archivos de FSx For Lustre, seleccione una de las Regiones de AWS opciones compatibles con. SageMaker HyperPod Después de elegir la Región de AWS que prefiera, también debe determinar qué zona de disponibilidad (AZ) utilizar.
Si utiliza nodos de SageMaker HyperPod cómputo AZs distintos de aquel en el AZs que está configurado el sistema de archivos de FSx For Lustre Región de AWS, es posible que se produzca una sobrecarga de comunicación y de red. Le recomendamos que utilice la misma zona de disponibilidad física que la de la cuenta de SageMaker HyperPod servicio para evitar cualquier tráfico entre zonas de disponibilidad entre los SageMaker HyperPod clústeres y su sistema de archivos de FSx For Lustre. Asegúrese de haberla configurado también con su VPC. Si desea utilizar Amazon FSx como sistema de archivos principal para el almacenamiento, debe configurar SageMaker HyperPod los clústeres con su VPC.