Configuración del complemento SageMaker HyperPod de observabilidad - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración del complemento SageMaker HyperPod de observabilidad

En la siguiente lista se describen los requisitos previos para configurar el complemento de observabilidad.

Para que las métricas de tu clúster de Amazon SageMaker HyperPod (SageMaker HyperPod) se envíen a un espacio de trabajo de Amazon Managed Service for Prometheus y, de forma opcional, verlas en Amazon Managed Grafana, adjunta primero las siguientes políticas y permisos gestionados a tu rol de consola.

  • Habilite AWS IAM Identity Center (IAM Identity Center) para usar Amazon Managed Grafana. Si el Centro de identidad de IAM aún no está activado en su cuenta, consulte Cómo empezar a utilizar el Centro de identidades de IAM. Además, cree al menos un usuario en el Centro de identidades de IAM.

  • Añada las siguientes políticas y permisos a su función.

    • AWS política gestionada: AmazonSageMakerHyperPodObservabilityAdminAccess

    • AWS política gestionada: AWSGrafana WorkspacePermissionManagement V2

    • AWS política gestionada: AmazonSageMakerFullAccess

    • Permisos adicionales para configurar las funciones de IAM necesarias para el acceso a los complementos Amazon Managed Grafana y Amazon Elastic Kubernetes Service:

      { "Version": "2012-10-17", "Statement": [ { "Sid": "CreateRoleAccess", "Effect": "Allow", "Action": [ "iam:CreateRole", "iam:CreatePolicy", "iam:AttachRolePolicy", "iam:ListRoles" ], "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityAddonPolicy*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityGrafanaPolicy*" ] }, { "Sid": "IAMGrafanaPassRoleAccess", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "Condition": { "StringLike": { "iam:PassedToService": [ "grafana.amazonaws.com" ] } } }, { "Sid": "IAMEKSPassRoleAccess", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "Condition": { "StringLike": { "iam:PassedToService": [ "pods.eks.amazonaws.com" ] } } }, { "Sid": "IAMGetRoleAccess", "Effect": "Allow", "Action": "iam:GetRole", "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*" ] } ] }
    • Se necesitan permisos adicionales para gestionar los usuarios del Centro de Identidad de IAM para Amazon Managed Grafana:

      { "Version": "2012-10-17", "Statement": [ { "Sid": "SSOAccess", "Effect": "Allow", "Action": [ "sso:ListProfileAssociations", "sso-directory:SearchUsers", "sso-directory:SearchGroups", "sso:AssociateProfile", "sso:DisassociateProfile" ], "Resource": [ "*" ] } ] }
    • Se necesitan permisos adicionales para eliminar y actualizar la asociación de identidad del pod para el complemento:

      { "Version": "2012-10-17", "Statement": [ { "Sid": "EKSPodIdentity", "Effect": "Allow", "Action": [ "eks:DeletePodIdentityAssociation", "eks:UpdatePodIdentityAssociation" ], "Resource": "*" } ] }

Una vez que te hayas asegurado de que cumples los requisitos anteriores, puedes instalar el complemento de observabilidad.

Para instalar rápidamente el complemento de observabilidad
  1. Abre la consola Amazon SageMaker AI en https://console.aws.amazon.com/sagemaker/.

  2. Ve a la página de detalles de tu clúster.

  3. En la pestaña Panel de control, busca el complemento denominado HyperPod Monitoring & Observability y selecciona Instalación rápida.

Para realizar una instalación personalizada del complemento de observabilidad
  1. Ve a la página de detalles de tu clúster.

  2. En la pestaña Panel de control, busca el complemento denominado HyperPod Monitoring & Observability y selecciona Instalación personalizada.

  3. Especifica las categorías de métricas que quieres ver. Para obtener más información sobre estas categorías de métricas, consulteSageMaker HyperPod métricas de clústeres.

  4. Especifica si quieres activar Amazon CloudWatch Logs.

  5. Especifique si desea que el servicio cree un nuevo espacio de trabajo de Amazon Managed Service para Prometheus.

  6. Para poder ver las métricas en los paneles de control de Grafana gestionada por Amazon, marca la casilla Utilizar un espacio de trabajo de Grafana gestionado por Amazon. Puedes especificar tu propio espacio de trabajo o dejar que el servicio cree uno nuevo para ti.

    nota

    Amazon Managed Grafana no está disponible en todos los países Regiones de AWS en los que está disponible Amazon Managed Service for Prometheus. Sin embargo, puede configurar un espacio de trabajo de Grafana en cualquier lugar Región de AWS y configurarlo para obtener datos de métricas de un espacio de trabajo de Prometheus que se encuentre en otro lugar. Región de AWS Para obtener más información, consulte Utilizar la configuración de la fuente de AWS datos para añadir Amazon Managed Service para Prometheus como fuente de datos y Connect to Amazon Managed Service para Prometheus y las fuentes de datos de Prometheus de código abierto.