Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Mettre à jour la configuration SageMaker HyperPod du cluster

Mode de mise au point
Mettre à jour la configuration SageMaker HyperPod du cluster - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Exécutez update-cluster pour mettre à jour la configuration d'un cluster.

Note

Vous ne pouvez pas modifier les informations du cluster EKS auxquelles votre HyperPod cluster est associé une fois celui-ci créé.

Note

Si des contrôles de santé approfondis sont exécutés sur le cluster, cette API ne fonctionnera pas comme prévu. Un message d'erreur peut s'afficher indiquant que des contrôles de santé approfondis sont en cours. Pour mettre à jour le cluster, vous devez attendre la fin des contrôles de santé approfondis.

  1. Créez un fichier de UpdateCluster requête au format JSON. Assurez-vous de spécifier le nom de cluster et le nom de groupe d'instances appropriés à mettre à jour. Vous pouvez modifier le type d'instance, le nombre d'instances, le script d'entrée de configuration du cycle de vie et le chemin d'accès au script.

    1. PourClusterName, spécifiez le nom du cluster que vous souhaitez mettre à jour.

    2. Pour InstanceGroupName

      1. Pour mettre à jour un groupe d'instances existant, spécifiez le nom du groupe d'instances que vous souhaitez mettre à jour.

      2. Pour ajouter un nouveau groupe d'instances, spécifiez un nouveau nom qui n'existe pas dans votre cluster.

    3. Pour InstanceType

      1. Pour mettre à jour un groupe d'instances existant, vous devez associer le type d'instance que vous avez initialement spécifié au groupe.

      2. Pour ajouter un nouveau groupe d'instances, spécifiez le type d'instance avec lequel vous souhaitez configurer le groupe.

    4. Pour InstanceCount

      1. Pour mettre à jour un groupe d'instances existant, spécifiez un entier correspondant au nombre d'instances souhaité. Vous pouvez fournir une valeur supérieure ou inférieure (jusqu'à 0) pour augmenter ou diminuer le groupe d'instances.

      2. Pour ajouter un nouveau groupe d'instances, spécifiez un entier supérieur ou égal à 1.

    5. En LifeCycleConfig effet, vous pouvez modifier les valeurs pour les deux SourceS3Uri et OnCreate comme vous le souhaitez pour mettre à jour le groupe d'instances.

    6. Pour ExecutionRole

      1. Pour mettre à jour un groupe d'instances existant, continuez à utiliser le même rôle IAM que celui que vous avez attaché lors de la création du cluster.

      2. Pour ajouter un nouveau groupe d'instances, spécifiez le rôle IAM que vous souhaitez associer.

    7. Pour ThreadsPerCore

      1. Pour mettre à jour un groupe d'instances existant, continuez à utiliser la même valeur que celle que vous avez spécifiée lors de la création du cluster.

      2. Pour ajouter un nouveau groupe d'instances, vous pouvez choisir n'importe quelle valeur parmi les options autorisées par type d'instance. Pour plus d'informations, recherchez le type d'instance et consultez la colonne Threads valides par cœur dans le tableau de référence des cœurs de processeur et des threads par cœur de processeur par type d'instance dans le guide de EC2 l'utilisateur Amazon.

    8. PourOnStartDeepHealthChecks, ajouter InstanceStress et InstanceConnectivity activerContrôles de santé approfondis.

    9. PourNodeRecovery, spécifiez Automatic d'activer la restauration automatique des nœuds. SageMaker HyperPod remplace ou redémarre les instances (nœuds) lorsque des problèmes sont détectés par l'agent de surveillance de l'état.

    L'extrait de code suivant est un modèle de fichier de requête JSON que vous pouvez utiliser. Pour plus d'informations sur la syntaxe des demandes et les paramètres de cette API, consultez la référence de l'UpdateClusterAPI.

    // update_cluster.json { // Required "ClusterName": "name-of-cluster-to-update", // Required "InstanceGroups": [{ "InstanceGroupName": "string", "InstanceType": "string", "InstanceCount": number, "LifeCycleConfig": { "SourceS3Uri": "string", "OnCreate": "string" }, "ExecutionRole": "string", "ThreadsPerCore": number, "OnStartDeepHealthChecks": [ "InstanceStress", "InstanceConnectivity" ] }], "NodeRecovery": "Automatic" }
  2. Exécutez la update-cluster commande suivante pour envoyer la demande.

    aws sagemaker update-cluster \ --cli-input-json file://complete/path/to/update_cluster.json
ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.