Installation de bibliothèques et de noyaux externes dans Amazon SageMaker Studio Classic - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Installation de bibliothèques et de noyaux externes dans Amazon SageMaker Studio Classic

Important

Depuis le 30 novembre 2023, l'expérience Amazon SageMaker Studio précédente s'appelle désormais Amazon SageMaker Studio Classic. La section suivante est spécifique à l'utilisation de l'application Studio Classic. Pour plus d'informations sur l'utilisation de l'expérience Studio mise à jour, consultezAmazon SageMaker Studio.

Plusieurs images sont déjà installées sur les blocs-notes Amazon SageMaker Studio Classic. Ces images contiennent des noyaux et des packages Python, notamment scikit-learn, Pandas,,, et NumPy MXnet. TensorFlow PyTorch Vous pouvez également installer vos propres images contenant les packages et noyaux de votre choix. Pour obtenir plus d'informations sur l'installation de votre propre image, consultez Apportez votre propre SageMaker image.

Les différents noyaux Jupyter des blocs-notes Amazon SageMaker Studio Classic sont des environnements conda distincts. Pour plus d'informations sur les environnements Conda, consultez la section Managing environments (Gestion des environnements).

Outils d'installation de package

La méthode que vous utilisez pour installer les packages Python à partir du terminal diffère selon l'image. Studio Classic prend en charge les outils d'installation de packages suivants :

  • Notebooks (Blocs-notes) - Les commandes suivantes sont prises en charge. Si l'une des méthodes suivantes ne fonctionne pas sur votre image, essayez l'autre.

    • %conda install

    • %pip install

  • Le terminal Jupyter - Vous pouvez installer des packages en utilisant directement pip et conda. Vous pouvez également utiliser apt-get install pour installer les packages du système à partir du terminal.

Note

Nous vous déconseillons d'utiliser pip install -u oupip install --user, car ces commandes installent des packages sur le volume Amazon EFS de l'utilisateur et peuvent potentiellement bloquer le redémarrage des JupyterServer applications. Au lieu de cela, utilisez une configuration de cycle de vie pour réinstaller les packages nécessaires au redémarrage des applications, comme indiqué dans Installer des packages en utilisant des configurations de cycle de vie.

Nous recommandons d'utiliser %pip et %conda pour installer des packages à partir d'un bloc-notes car ils prennent correctement en compte l'environnement actif ou l'interpréteur utilisé. Pour de plus amples informations, veuillez consulter Add %pip and %conda magic functions. Vous pouvez également utiliser la syntaxe de la commande système (lignes commençant par !) pour installer des packages. Par exemple : !pip install et !conda install.

Conda

Conda est un système de gestion de paquets open source et un système de gestion d'environnement qui permet d'installer des packages et leurs dépendances. SageMaker prend en charge l'utilisation de conda avec l'un de ces deux canaux principaux : le canal par défaut ou le canal conda-forge. Pour de plus amples informations, veuillez consulter Conda channels. Le canal conda-forge est un canal communautaire où les contributeurs peuvent télécharger des packages.

Note

L'installation de packages depuis conda-forge peut prendre jusqu'à dix minutes. Le timing est lié à la façon dont conda résout le graphe de dépendances.

Tous les environnements SageMaker proposés sont fonctionnels. Les packages installés par l'utilisateur peuvent ne pas fonctionner correctement.

Conda dispose de deux méthodes pour activer les environnements : conda activate et source activate. Pour obtenir plus d'informations, consultez la section Managing environment (Gestion de l'environnement).

Opérations conda prises en charge
  • conda install d'un package dans un seul environnement

  • conda install d'un package dans tous les environnements

  • Installation d'un package à partir du référentiel conda principal

  • Installation d'un package à partir de conda-forge

  • Changement de l'emplacement d'installation de conda pour utiliser Amazon EBS

  • Prise en charge de conda activate et de source activate

Pip

Pip est l'outil pour l'installation et la gestion des packages Python. Pip recherche des packages sur l'index Python Package Index (PyPI) par défaut. Contrairement à Conda, Pip ne dispose pas de prise en charge d'environnement intégré. Par conséquent, pip n'est pas aussi complet que conda lorsqu'il s'agit de packages avec des dépendances de bibliothèques natives ou système. Pip peut être utilisé pour installer des packages dans des environnements conda. Vous pouvez utiliser des référentiels de packages alternatifs avec pip au lieu de PyPI.

Opérations pip prises en charge
  • Utilisation de pip pour installer un package sans environnement conda actif

  • Utilisation de pip pour installer un package dans un environnement conda

  • Utilisation de pip pour installer un package dans tous les environnements conda

  • Changer l'emplacement d'installation de pip pour utiliser Amazon EBS

  • Utilisation d'un référentiel alternatif pour installer des packages avec pip

Non pris en charge

SageMaker vise à prendre en charge autant d'opérations d'installation de packages que possible. Toutefois, si les packages ont été installés par SageMaker et que vous utilisez les opérations suivantes sur ces packages, cela peut rendre votre environnement instable :

  • Désinstallation

  • Rétrogradation

  • Mise à niveau

En raison de problèmes potentiels liés aux conditions ou aux configurations du réseau, ou à la disponibilité de conda or PyPi, les packages peuvent ne pas être installés dans un délai fixe ou déterministe.

Note

Une tentative d'installation d'un package dans un environnement avec des dépendances incompatibles peut entraîner un échec. Si des problèmes surviennent, vous pouvez contacter le responsable de la bibliothèque pour mettre à jour les dépendances des packages. Lorsque vous modifiez l'environnement, par exemple en supprimant ou en mettant à jour des packages existants, cela peut entraîner une instabilité de cet environnement.

Installer des packages en utilisant des configurations de cycle de vie

Installez des images et des noyaux personnalisés sur le volume Amazon EBS de l'instance Studio Classic afin qu'ils persistent lorsque vous arrêtez et redémarrez le bloc-notes, et que les bibliothèques externes que vous installez ne soient pas mises à jour par. SageMaker Pour ce faire, utilisez une configuration de cycle de vie qui inclut à la fois un script qui s'exécute lorsque vous créez le bloc-notes (on-create) et un script qui s'exécute chaque fois que vous redémarrez le bloc-notes (on-start). Pour plus d'informations sur l'utilisation des configurations de cycle de vie avec Studio Classic, consultezUtiliser des configurations de cycle de vie avec Amazon SageMaker Studio Classic. Pour des exemples de scripts de configuration du cycle de vie, consultez la section Exemples de configuration du cycle de vie de SageMaker Studio Classic.