Requisitos previos para la observabilidad de los SageMaker HyperPod conglomerados - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos previos para la observabilidad de los SageMaker HyperPod conglomerados

Antes de continuar con los pasos necesariosInstale paquetes de exportación de métricas en su clúster HyperPod , asegúrese de que se cumplen los siguientes requisitos previos.

Activar IAM Identity Center

Para habilitar la observabilidad de su SageMaker HyperPod clúster, primero debe habilitar IAM Identity Center. Este es un requisito previo para implementar una AWS CloudFormation pila que configure el espacio de trabajo de Grafana gestionado por Amazon y el Servicio gestionado de Amazon para Prometheus. Ambos servicios también requieren el centro de identidad de IAM para la autenticación y la autorización, lo que garantiza el acceso seguro de los usuarios y la administración de la infraestructura de monitoreo.

Para obtener instrucciones detalladas sobre cómo habilitar el Centro de Identidad de IAM, consulte la sección Habilitación del Centro de Identidad de IAM en la Guía del usuario del Centro de Identidad de AWS IAM.

Tras activar correctamente el Centro de identidad de IAM, configure una cuenta de usuario que sirva de usuario administrativo durante los siguientes procedimientos de configuración.

Cree e implemente una pila para garantizar la AWS CloudFormation observabilidad SageMaker HyperPod

Cree e implemente una CloudFormation pila de SageMaker HyperPod observabilidad para monitorear las métricas de los HyperPod clústeres en tiempo real con Amazon Managed Service for Prometheus y Amazon Managed Grafana. Para implementar la pila, tenga en cuenta que también debe habilitar su centro de identidad de IAM de antemano.

Utilice el CloudFormation script de muestra cluster-observability.yamlque le ayuda a configurar las subredes de Amazon VPC, los sistemas de archivos Amazon FSx for Lustre, los buckets de Amazon S3 y las funciones de IAM necesarias para crear una pila de observabilidad de clústeres. HyperPod