Débogage de configurations de cycle de vie - Amazon SageMaker

Débogage de configurations de cycle de vie

Les rubriques suivantes montrent comment obtenir des informations sur vos configurations de cycle de vie et comment les déboguer.

Vérifier le processus de configuration du cycle de vie à partir d'Amazon CloudWatch Logs

Les configurations de cycle de vie enregistrent uniquement STDOUT et STDERR. STDOUT est la sortie par défaut des scripts bash, tandis que STDERR peut être écrit en ajoutant >&2 à la fin d'une commande bash. Par exemple : «  », echo 'hello'>&2. Les journaux de vos configurations de cycle de vie sont publiés sur votre compte AWS via CloudWatch. Ces journaux se trouvent dans le flux de journaux /aws/sagemaker/studio de la console AWS CloudWatch.

  1. Ouvrez la console CloudWatch à l'adresse https://console.aws.amazon.com/cloudwatch/..

  2. Sélectionnez Logs à gauche. Dans le menu déroulant, sélectionnez Log Groups.

  3. Depuis la page Log Groups, recherchez aws/sagemaker/studio. Sélectionnez le groupe de journaux .

  4. Depuis la page aws/sagemaker/studio Log Group, accédez à l'onglet Log Streams.

  5. Pour trouver les journaux d'une application spécifique, recherchez Log Streams en utilisant le format suivant :

    <DomainId>/<UserProfileName>/<AppType>/<AppName>

    Par exemple, pour rechercher les journaux de configuration du cycle de vie pour Domain (Domaine) d-m85lcu8vbqmz, UserProfile (Profil utilisateur) i-sonic-js, Apptype (Type d'application) JupyterServer et AppName (Nom d'application) test-lcc-echo, utilisez la chaîne de recherche suivante :

    d-m85lcu8vbqmz/i-sonic-js/JupyterServer/test-lcc-echo
  6. Sélectionnez le flux de journal auquel est ajouté LifecycleConfigOnStart pour afficher les journaux d'exécution du script.

Échec de l'appli JupyterServer (Serveur Jupyter)

Si votre appli JupyterServer (serveur Jupyter) plante en raison d'un problème avec la configuration du cycle de vie jointe, Studio affiche le message d'erreur suivant sur l'écran de démarrage de Studio.

Failed to create SageMaker Studio due to start-up script failure

Cliquez sur le lien View script logs pour afficher les journaux CloudWatch pour votre appli JupyterServer (Serveur Jupyter).

Dans le cas où la configuration de cycle de vie défectueuse est spécifiée dans le DefaultResourceSpec de votre domaine ou UserProfil (Profil utilisateur) Studio, Studio continue d'utiliser la configuration de cycle de vie même après le redémarrage de Studio.

Pour résoudre cette erreur, suivez les étapes de Définition de configurations de cycle de vie par défaut afin de supprimer le script de configuration du cycle de vie du DefaultResourceSpec ou sélectionnez un autre script à l'aide de l'AWS CLI. Lancez ensuite une nouvelle appli JupyterServer (Serveur Jupyter).

Échec de l'appli KernelGateway (Passerelle du kernel)

Si votre appli KernelGateway (Passerelle du kernel) plante en raison d'un problème avec la configuration du cycle de vie jointe, Studio affiche un message d'erreur dans votre bloc-notes Studio.

Cliquez sur le lien View script logs pour afficher les journaux CloudWatch pour votre application KernelGateway (Passerelle du kernel).

Dans ce cas, votre configuration de cycle de vie est spécifiée dans Studio Launcher lors du lancement d'un nouveau bloc-notes Studio.

Pour résoudre cette erreur, utilisez le lanceur Studio pour sélectionner une autre configuration de cycle de vie ou sélectionnez No script.

Note

Une configuration de cycle de vie KernelGateway (Passerelle du kernel) par défaut spécifiée dans DefaultResourceSpec s'applique à toutes les images KernelGateway (Passerelle du kernel) dans le domaine Studio, sauf si l'utilisateur sélectionne un autre script dans la liste présentée dans le lanceur Studio. Le script par défaut s'exécute également si No Script est sélectionné par l'utilisateur. Pour plus d'informations sur la sélection d'un script, veuillez consulter Étape 3 : choisir une configuration du cycle de vie lors du lancement d'une nouvelle appli.

Délai d'expiration de la configuration du cycle de vie

Le délai d'expiration de la configuration du cycle de vie est limité à 5 minutes. Si un script de configuration du cycle de vie prend plus de 5 minutes à s'exécuter, Studio renvoie une erreur.

Pour résoudre cette erreur, assurez-vous que votre script de configuration du cycle de vie se termine en moins de 5 minutes.