SageMaker HyperPod gestion des clusters - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

SageMaker HyperPod gestion des clusters

Les rubriques suivantes traitent de la journalisation et de la gestion des SageMaker HyperPod clusters.

Journalisation SageMaker HyperPod des événements

Tous les événements et journaux SageMaker HyperPod sont enregistrés sur Amazon CloudWatch sous le nom du groupe de journaux/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]. Chaque appel à l'CreateClusterAPI crée un nouveau groupe de journaux. La liste suivante contient tous les flux de journaux disponibles collectés dans chaque groupe de journaux.

Nom du groupe de journaux Nom du flux de journal
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

Journalisation SageMaker HyperPod au niveau de l'instance

Vous pouvez accéder aux LifecycleScript journaux publiés CloudWatch lors de la configuration de l'instance de cluster. Chaque instance du cluster créé génère un flux de journal distinct, qui se distingue par son LifecycleConfig/[instance-group-name]/[instance-id] format.

Tous les journaux écrits /var/log/provision/provisioning.log sont téléchargés dans le CloudWatch flux précédent. LifecycleScripts Échantillonnez lors de la 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configredirection de leur stdout et stderr vers cet emplacement. Si vous utilisez vos scripts personnalisés, rédigez vos journaux à l'/var/log/provision/provisioning.logendroit où ils seront disponibles CloudWatch.

Balisage des ressources

AWS Le système de balisage permet de gérer, d'identifier, d'organiser, de rechercher et de filtrer les ressources. SageMaker HyperPod prend en charge le balisage, afin que vous puissiez gérer les clusters en tant que AWS ressource. Lors de la création ou de la modification d'un cluster existant, vous pouvez ajouter ou modifier des balises pour le cluster. Pour en savoir plus sur le balisage en général, consultez la section Marquage de vos AWS ressources.

Utilisation de l'interface utilisateur SageMaker HyperPod de la console

Lorsque vous créez un nouveau cluster et que vous modifiez un cluster, vous pouvez ajouter, supprimer ou modifier des balises.

Utilisation des SageMaker HyperPod API

Lorsque vous rédigez un fichier de demande d'UpdateClusterAPI CreateClusterou un fichier de demande d'API au format JSON, modifiez la Tags section.

À l'aide des commandes AWS CLI de balisage pour SageMaker

Pour étiqueter un cluster

Utiliser aws sagemaker add-tagscomme suit.

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

Pour annuler le balisage d'un cluster

Utiliser aws sagemaker delete-tagscomme suit.

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

Pour répertorier les balises d'une ressource

Utiliser aws sagemaker list-tagscomme suit.

aws sagemaker list-tags --resource-arn cluster_ARN