Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Observabilidad del SageMaker HyperPod clúster de Amazon orquestado por Amazon EKS
Para lograr una observabilidad completa de los recursos y componentes de software de su clúster de Amazon SageMaker HyperPod (SageMaker HyperPod), integre el clúster con Amazon CloudWatch Container Insights, Amazon Managed Service for Prometheus y Amazon Managed Grafana. Estas herramientas proporcionan visibilidad del estado del clúster, las métricas de rendimiento y la utilización de los recursos.
La integración con Amazon Managed Service para Prometheus permite exportar métricas relacionadas con los recursos de HyperPod su clúster, lo que proporciona información sobre su rendimiento, uso y estado. La integración con Amazon Managed Grafana permite la visualización de estas métricas a través de varios paneles de Grafana que ofrecen una interfaz intuitiva para supervisar y analizar el comportamiento del clúster. Al aprovechar estos servicios, obtiene una visión centralizada y unificada de su HyperPod clúster, lo que facilita la supervisión proactiva, la solución de problemas y la optimización de sus cargas de trabajo de formación distribuidas.
nota
Si bien CloudWatch Amazon Managed Service for Prometheus y Amazon Managed Grafana se centran en las métricas operativas (por ejemplo, el estado del sistema o la formación, el rendimiento laboral) SageMaker HyperPod , los informes de uso complementan la gobernanza de tareas para proporcionar información sobre la responsabilidad financiera y de los recursos. Estos informes registran lo siguiente:
-
Utilización del cómputo (GPU/CPU/Neuron Core hours) across namespaces/teams
-
Atribución de costos entre los recursos asignados y los prestados
-
Tendencias históricas (hasta 180 días) de auditoría y optimización
Para obtener más información sobre cómo configurar y generar informes de uso, consulte Cómo informar sobre el uso de la informática en HyperPod.
sugerencia
Para encontrar ejemplos prácticos y soluciones, consulte también la sección Observabilidad
Continúe con los siguientes temas para configurar la observabilidad de los SageMaker HyperPod clústeres.