Création d'une instance de bloc-notes - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'une instance de bloc-notes

Une instance Amazon SageMaker Notebook est une instance de calcul ML exécutant l'application Jupyter Notebook. SageMaker gère la création de l'instance et des ressources associées. Utilisez les blocs-notes Jupyter dans votre instance de bloc-notes pour préparer et traiter les données, écrire du code pour entraîner des modèles, déployer des modèles vers l' SageMaker hébergement et tester ou valider vos modèles.

Pour créer une instance de bloc-notes, utilisez la SageMaker console ou CreateNotebookInstanceAPI.

Le type d'instance de bloc-notes que vous choisissez dépend de la façon dont vous utilisez votre instance de bloc-notes. Vous souhaitez vous assurer que votre instance de bloc-notes n'est pas liée par la mémoire, le processeur ou les E/S. Si vous envisagez de charger un jeu de données en mémoire sur l'instance de bloc-notes à des fins d'exploration ou de prétraitement, nous vous recommandons de choisir un type d'instance avec suffisamment de mémoire RAM pour votre jeu de données. Cela nécessiterait une instance avec au moins 16 Go de mémoire (.xlarge ou plus). Si vous envisagez d'utiliser le bloc-notes pour un prétraitement intensif, nous vous recommandons de choisir une instance optimisée pour le calcul, telle qu'une instance c4 ou c5.

Lorsque vous utilisez un SageMaker bloc-notes, il est recommandé d'utiliser l'instance du bloc-notes pour orchestrer d'autres AWS services. Par exemple, vous pouvez utiliser l'instance de bloc-notes pour gérer le traitement de grands jeux de données en appelant les services AWS Glue pour ETL (extraction, transformation et chargement) ou Amazon EMR pour le mappage et la réduction des données à l'aide de Hadoop. Vous pouvez utiliser les services AWS comme formes temporaires de calcul ou de stockage de vos données.

Vous pouvez stocker et récupérer vos données d'entraînement et de test à l'aide d'un compartiment Amazon S3. Vous pouvez ensuite l'utiliser SageMaker pour entraîner et créer votre modèle, de sorte que le type d'instance de votre bloc-notes n'ait aucune incidence sur la rapidité de l'entraînement et des tests de votre modèle.

Après avoir reçu la demande, SageMaker effectue les opérations suivantes :

  • Crée une interface réseau : si vous choisissez la configuration VPC facultative SageMaker , crée l'interface réseau dans votre VPC. Il utilise l'ID de sous-réseau que vous fournissez dans la demande pour déterminer dans quelle zone de disponibilité créer le sous-réseau. SageMaker associe le groupe de sécurité que vous indiquez dans la demande au sous-réseau. Pour plus d’informations, consultez Connecter une instance de bloc-notes dans un VPC à des ressources externes.

  • Lance une instance de calcul ML : SageMaker lance une instance de calcul ML dans un SageMaker VPC. SageMaker exécute les tâches de configuration qui lui permettent de gérer votre instance de bloc-notes, et si vous avez spécifié votre VPC, il active le trafic entre votre VPC et l'instance de bloc-notes.

  • Installe les packages et bibliothèques Anaconda pour les plateformes d'apprentissage profond courantes : SageMaker installe tous les packages Anaconda inclus dans le programme d'installation. Pour plus d'informations, consultez Liste des packages Anaconda. SageMaker Installe également les bibliothèques d'apprentissage en profondeur TensorFlow et Apache MXnet.

  • Attache un volume de stockage ML : SageMaker attache un volume de stockage ML à l'instance de calcul ML. Vous pouvez utiliser le volume comme zone de travail pour nettoyer le jeu de données d'entraînement ou pour stocker temporairement des données de validation, de test ou d'autres données. Pour le volume, choisissez n'importe quelle taille comprise entre 5 Go et 16 384 Go, par incréments de 1 Go. La valeur par défaut est 5 Go. Les volumes de stockage ML étant chiffrés, il est SageMaker impossible de déterminer la quantité d'espace libre disponible sur le volume. Pour cette raison, vous pouvez augmenter la taille du volume lorsque vous mettez à jour une instance de bloc-notes, mais vous ne pouvez pas réduire la taille de volume. Si vous souhaitez réduire la taille du volume de stockage ML utilisé, créez une nouvelle instance de bloc-notes avec la taille souhaitée.

    Seuls les fichiers et les données enregistrés dans le dossier /home/ec2-user/SageMaker sont conservés entre les sessions d'instance de bloc-notes. Les fichiers et les données enregistrés en dehors de ce répertoire sont remplacés lorsque l'instance de bloc-notes s'arrête et redémarre. Chaque répertoire /tmp d'instance de bloc-notes offre un stockage minimum instantané de 10 Go dans une instance de bloc-notes. Un stockage d'instance offre un stockage temporaire de niveau bloc qui n'est pas conservé. Lorsque l'instance est arrêtée ou redémarrée, le SageMaker contenu du répertoire est supprimé. Ce stockage temporaire fait partie du volume racine de l'instance bloc-notes.

  • Copie des exemples de bloc-notes Jupyter – Ces exemples de code Python illustrent des exercices d'entraînement et d'hébergement du modèle qui utilisent des algorithmes et des jeux de données d'entraînement différents.

Pour créer une instance de SageMaker bloc-notes :
  1. Ouvrez la SageMaker console à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Choisissez Instances de bloc-notes, puis Créer une instance de bloc-notes.

  3. Sur la page Créer une instance de bloc-notes, fournissez les informations suivantes :

    1. Pour Notebook instance name (Nom d'instance de bloc-notes), saisissez un nom pour votre ordinateur bloc-notes.

    2. Pour Notebook instance type (Type d'instance de bloc-notes), choisissez une taille d'instance adaptée à votre cas d'utilisation. Pour obtenir la liste des types d'instances et des quotas pris en charge, consultez Amazon SageMaker Service Quotas.

    3. Dans Elastic Inference (Inférence Elastic), choisissez un type d'accélérateur d'inférence à associer à l'instance de bloc-notes si vous prévoyez d'effectuer des inférences à partir de l'instance de bloc-notes, ou choisissez none (aucun). Pour de plus amples informations sur l'inférence élastique, veuillez consulter Utiliser Amazon SageMaker Elastic Inference (EI) .

    4. Pour Platform Identifier (Identificateur de plateforme), choisissez un type de plateforme sur lequel créer l'instance de bloc-notes. Ce type de plate-forme détermine le système d'exploitation et la JupyterLab version avec lesquels votre instance de bloc-notes est créée. Pour plus d'informations sur le type d'identificateur de plateforme, veuillez consulter Instances de bloc-notes Amazon Linux 2. Pour plus d'informations sur les versions JupyterLab, veuillez consulter JupyterLab gestion des versions.

    5. (Facultatif) L'Additional configuration (configuration supplémentaire) permet aux utilisateurs avancés de créer un script shell qui peut s'exécuter lorsque vous créez ou démarrez l'instance. Ce script, appelé script de configuration du cycle de vie, peut être utilisé pour définir l'environnement du bloc-notes ou pour exécuter d'autres fonctions. Pour plus d'informations, veuillez consulter Personnalisation d'une instance de bloc-notes à l'aide d'un script de configuration du cycle de vie.

    6. (Facultatif) La configuration supplémentaire vous permet également de spécifier la taille, en Go, du volume de stockage ML attaché à l'instance de bloc-notes. Vous pouvez choisir une taille comprise entre 5 et 16,384 Go, par incréments de 1 Go. Vous pouvez utiliser le volume pour nettoyer le jeu de données d'entraînement ou stocker temporairement des données de validation ou d'autres données.

    7. (Facultatif) Pour Minimum IMDS Version (Version IMDS minimale), sélectionnez une version dans la liste déroulante. Si cette valeur est définie sur v1, les deux versions peuvent être utilisées avec l'instance de bloc-notes. Si v2 est sélectionné, seule IMDSv2 peut être utilisée avec l'instance de bloc-notes. Pour plus d'informations sur IMDSv2, consultez Utiliser IMDSv2.

      Note

      À compter du 31 octobre 2022, la version minimale IMDS par défaut pour les instances d' SageMaker ordinateurs portables passe d'IMDSv1 à IMDSv2.

      À compter du 1er février 2023, IMDSv1 ne sera plus disponible pour la création de nouvelles instances de bloc-notes. Après cette date, vous pouvez créer des instances de bloc-notes avec une version IMDS minimale de 2.

    8. Pour le rôle IAM, choisissez un rôle IAM existant dans votre compte disposant des autorisations nécessaires pour accéder aux SageMaker ressources ou choisissez Créer un nouveau rôle. Si vous choisissez Créer un nouveau rôle, SageMaker crée un rôle IAM nomméAmazonSageMaker-ExecutionRole-YYYYMMDDTHHmmSS. La politique gérée AWS AmazonSageMakerFullAccess est attachée au rôle. Le rôle fournit des autorisations qui permettent à l'instance du bloc-notes SageMaker d'appeler Amazon S3.

    9. Dans Root access (Accès racine), pour activer l'accès racine pour tous les utilisateurs d'instances de bloc-notes, choisissez Enable (Activer). Pour désactiver l'accès racine pour les utilisateurs, choisissez Disable (Désactiver). Si vous activez l'accès racine, tous les utilisateurs d'instances de bloc-notes ont des privilèges d'administrateur et peuvent accéder à tous les fichiers et les modifier.

    10. (Facultatif) La clé de chiffrement vous permet de chiffrer des données sur le volume de stockage ML attaché à l'instance de bloc-notes à l'aide d'une clé AWS Key Management Service (AWS KMS). Si vous envisagez de stocker des informations sensibles sur le volume de stockage de Machine Learning, envisagez de les chiffrer.

    11. (Facultatif) Le réseau vous permet de placer votre instance de bloc-notes dans un Virtual Private Cloud (VPC). Un VPC fournit une sécurité supplémentaire et restreint l'accès aux ressources du VPC à partir de sources extérieures au VPC. Pour plus d'information sur VPC, veuillez consulter le Guide de l'utilisateur Amazon VPC.

      Pour ajouter votre instance de bloc-notes à un VPC :

      1. Choisissez le VPC et un. SubnetId

      2. Pour Security Group (Groupe de sécurité), sélectionnez le groupe de sécurité par défaut de votre VPC.

      3. Si vous avez besoin de votre instance de bloc-notes pour accéder à Internet, activez l'accès direct à Internet. Pour Direct internet access (Accès Internet direct), choisissez Enable (activer). L'accès à Internet peut rendre votre instance de bloc-notes moins sécurisée. Pour plus d’informations, consultez Connecter une instance de bloc-notes dans un VPC à des ressources externes.

    12. (Facultatif) Pour associer des référentiels git à l'instance de bloc-notes, choisissez un référentiel par défaut et jusqu'à 3 référentiels supplémentaires. Pour plus d’informations, consultez Associer des référentiels Git à des instances de SageMaker Notebook.

    13. Choisissez Create notebook instance (Créer une instance de bloc-notes).

      En quelques minutes, Amazon SageMaker lance une instance de calcul ML (dans ce cas, une instance de bloc-notes) et y attache un volume de stockage ML. L'instance de bloc-notes possède un serveur de blocs-notes Jupyter préconfiguré et un ensemble de bibliothèques Anaconda. Pour de plus amples informations, veuillez consulter l'API CreateNotebookInstance.

  4. Lorsque l'état de l'instance de bloc-notes est InService, dans la console, l'instance de bloc-notes est prête à l'emploi. Choisissez Open Jupyter (Ouvrir Jupyter) en regard du nom du bloc-notes pour ouvrir le tableau de bord Jupyter classique.

    Note

    Pour renforcer la sécurité de votre instance de SageMaker bloc-notes Amazon, tous les notebook.region.sagemaker.aws domaines régionaux sont enregistrés dans la liste des suffixes publics (PSL) Internet. Pour plus de sécurité, nous vous recommandons d'utiliser des cookies avec un __Host- préfixe si vous devez définir des cookies sensibles pour les domaines de vos instances de SageMaker bloc-notes. Cela vous permettra de protéger votre domaine contre les tentatives de falsification de requêtes intersites (CSRF). Pour plus d'informations, consultez la page Set-Cookie sur le site web de documentation pour développeurs de mozilla.org.

    Vous pouvez choisir Ouvrir JupyterLab pour ouvrir le JupyterLab tableau de bord. Le tableau de bord permet d'accéder à votre instance de bloc-notes et à des exemples de bloc-notes SageMaker contenant des procédures de code complet. Ces procédures pas à pas montrent comment effectuer des tâches SageMaker d'apprentissage automatique courantes. Pour plus d’informations, consultez Exemples de blocs-notes. Pour plus d’informations, consultez Contrôler l'accès root à une instance de SageMaker bloc-notes.

    Pour de plus amples informations sur les blocs-notes Jupyter, veuillez consulter Jupyter.