Conditions préalables à l'observabilité des SageMaker HyperPod clusters - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Conditions préalables à l'observabilité des SageMaker HyperPod clusters

Avant de procéder aux étapes deInstallez des packages d'exportation de métriques sur votre HyperPod cluster, assurez-vous que les conditions préalables suivantes sont remplies.

Activer IAM Identity Center

Pour activer l'observabilité de votre SageMaker HyperPod cluster, vous devez d'abord activer IAM Identity Center. Il s'agit d'une condition préalable au déploiement d'une AWS CloudFormation pile qui configure l'espace de travail Amazon Managed Grafana et Amazon Managed Service pour Prometheus. Ces deux services nécessitent également l'IAM Identity Center pour l'authentification et l'autorisation, afin de garantir un accès utilisateur sécurisé et la gestion de l'infrastructure de surveillance.

Pour obtenir des instructions détaillées sur l'activation d'IAM Identity Center, consultez la section Activation d'IAM Identity Center dans le guide de l'utilisateur d'AWS IAM Identity Center.

Après avoir activé IAM Identity Center avec succès, configurez un compte utilisateur qui servira d'utilisateur administratif pendant les périodes de configuration suivantes.

Créez et déployez une AWS CloudFormation pile pour l' SageMaker HyperPodobservabilité

Créez et déployez une CloudFormation pile d' SageMaker HyperPod observabilité afin de surveiller les métriques du HyperPod cluster en temps réel à l'aide d'Amazon Managed Service pour Prometheus et d'Amazon Managed Grafana. Pour déployer la pile, notez que vous devez également activer votre IAM Identity Center au préalable.

Utilisez l'exemple de CloudFormation script cluster-observability.yamlqui vous aide à configurer les sous-réseaux Amazon VPC, les systèmes de fichiers Amazon FSx for Lustre, les compartiments Amazon S3 et les rôles IAM nécessaires à la création d'une pile d'observabilité de cluster. HyperPod