Création de SageMaker HyperPod clusters à l'aide AWS CloudFormation de modèles - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création de SageMaker HyperPod clusters à l'aide AWS CloudFormation de modèles

Vous pouvez créer des SageMaker HyperPod clusters à l'aide CloudFormation des modèles pour HyperPod. Vous devez procéder AWS CLI à l'installation pour continuer.

Configurez les ressources dans la console et déployez-les à l'aide de CloudFormation

Vous pouvez configurer les ressources à l'aide des modèles AWS Management Console et les déployer à l'aide CloudFormation des modèles.

Procédez comme suit :

  1. Suivez les instructions Commencer à SageMaker HyperPod utiliser la console SageMaker AI pour configurer les AWS ressources dont vous aurez besoin pour créer votre cluster.

  2. À la fin de la page Créer un cluster, choisissez Télécharger les paramètres du CloudFormation modèle. Cela ouvrira la fenêtre Utiliser le fichier de configuration pour créer le cluster à l'aide de la AWS CLI fenêtre située à droite de la page.

  3. Dans la fenêtre Utiliser le fichier de configuration pour créer le cluster à l'aide de la AWS CLI fenêtre, choisissez Télécharger le fichier de paramètres de configuration. Le fichier sera téléchargé sur votre machine. Vous pouvez modifier le fichier JSON de configuration en fonction de vos besoins ou le laisser tel quel si aucune modification n'est requise.

  4. Exécutez la AWS CLI commande create-stack pour déployer la CloudFormation pile qui fournira les ressources configurées et créera le HyperPod cluster.

    aws cloudformation create-stack --stack-name my-stack --template-url https://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  5. Pour consulter l'état du provisionnement des ressources, accédez à la CloudFormation console.

    Une fois la création du cluster terminée, affichez le nouveau cluster sous Clusters dans le volet principal de la SageMaker HyperPod console. Vous pouvez vérifier son état affiché dans la colonne État.

  6. Une fois que le statut du cluster est passé à « activé »InService, vous pouvez commencer à vous connecter aux nœuds du cluster. Pour accéder aux nœuds du cluster et commencer à exécuter des charges de travail ML, consultezOffres d'emploi sur SageMaker HyperPod des clusters.

Configuration des ressources et déploiement à l'aide de CloudFormation

Vous pouvez configurer les ressources et les déployer à l'aide CloudFormation des modèles pour SageMaker HyperPod.

Procédez comme suit :

  1. Téléchargez un CloudFormation modèle SageMaker HyperPod depuis le sagemaker-hyperpod-cluster-setup GitHub référentiel.

  2. Exécutez la AWS CLI commande create-stack pour déployer la CloudFormation pile qui fournira les ressources configurées et créera le HyperPod cluster.

    aws cloudformation create-stack --stack-name my-stack --template-url URL_of_the_file_that_contains_the_template_body --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  3. Pour consulter l'état du provisionnement des ressources, accédez à la CloudFormation console.

    Une fois la création du cluster terminée, affichez le nouveau cluster sous Clusters dans le volet principal de la SageMaker HyperPod console. Vous pouvez vérifier son état affiché dans la colonne État.

  4. Une fois que le statut du cluster est passé à « activé »InService, vous pouvez commencer à vous connecter aux nœuds du cluster. Pour accéder aux nœuds du cluster et commencer à exécuter des charges de travail ML, consultezOffres d'emploi sur SageMaker HyperPod des clusters.