JupyterLab guía de usuario - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

JupyterLab guía de usuario

Esta guía muestra a JupyterLab los usuarios cómo ejecutar flujos de trabajo de análisis y aprendizaje automático en SageMaker Studio. Puedes conseguir un almacenamiento rápido y ampliar o reducir el rendimiento de tu proceso en función de tus necesidades.

JupyterLab admite espacios privados y compartidos. Los espacios privados están destinados a un único usuario de un dominio. Los espacios compartidos permiten que otros usuarios de tu dominio colaboren contigo en tiempo real. Para obtener información sobre los espacios de Studio, consulteEspacios de Amazon SageMaker Studio.

Para empezar a JupyterLab utilizarlos, crea un espacio e inicia tu JupyterLab aplicación. El espacio en el que se ejecuta JupyterLab la aplicación es un JupyterLab espacio. El JupyterLab espacio utiliza una única EC2 instancia de Amazon para el procesamiento y un único EBS volumen de Amazon para el almacenamiento. Todo lo que hay en tu espacio, como el código, el perfil de git y las variables de entorno, se almacenan en el mismo EBS volumen de Amazon. El volumen tiene 3000 IOPS y un rendimiento de 125 megabytes por segundo (). MBps Puede utilizar el almacenamiento rápido para abrir y ejecutar varios cuadernos Jupyter en la misma instancia. También puede cambiar los núcleos de un bloc de notas muy rápidamente.

El administrador ha configurado los ajustes de EBS almacenamiento predeterminados de Amazon para tu espacio. El tamaño de almacenamiento predeterminado es de 5 GB, pero puedes aumentar la cantidad de espacio disponible. Puedes hablar con tu administrador para que te dé las pautas.

Puedes cambiar el tipo de EC2 instancia de Amazon que vas a utilizar para ejecutar JupyterLab y ampliar o reducir el procesamiento en función de tus necesidades. Las instancias de Fast Launch se inician mucho más rápido que las demás instancias.

El administrador puede proporcionarle una configuración del ciclo de vida que personalice su entorno. Puede especificar la configuración del ciclo de vida al crear el espacio.

Si tu administrador te da acceso a un AmazonEFS, puedes configurar tu JupyterLab espacio para acceder a él.

De forma predeterminada, la JupyterLab aplicación usa la imagen SageMaker de distribución. Esto incluye la compatibilidad con muchos paquetes de aprendizaje automático, análisis y aprendizaje profundo. Sin embargo, si necesita una imagen personalizada, su administrador puede ayudarlo a proporcionar acceso a las imágenes personalizadas.

El EBS volumen de Amazon persiste independientemente de la duración de la instancia. No perderás tus datos cuando cambies de instancia. Usa las bibliotecas de administración de paquetes conda y pip para crear entornos personalizados reproducibles que persistan incluso cuando cambies de tipo de instancia.

Para empezar a usarlo JupyterLab, cree un espacio o elija el espacio que su administrador creó para usted y ábralo. JupyterLab

Utilice el siguiente procedimiento para crear un espacio y abrirlo JupyterLab.

Para crear un espacio y abrirlo JupyterLab
  1. Abra Studio. Para obtener información sobre cómo abrir Studio, consulteLanza Amazon SageMaker Studio.

  2. Elija JupyterLab.

  3. Selecciona Crear JupyterLab espacio.

  4. En Nombre, especifique el nombre del espacio.

  5. (Opcional) Seleccione Compartir con mi dominio para crear un espacio compartido.

  6. Selecciona Crear espacio.

  7. (Opcional) Por ejemplo, especifique la EC2 instancia de Amazon que ejecuta el espacio.

  8. (Opcional) En Imagen, especifique una imagen que haya proporcionado el administrador para personalizar el entorno.

  9. (Opcional) Para la configuración del espacio, especifique lo siguiente:

    • Almacenamiento (GB): hasta 100 GB o la cantidad que especifique el administrador.

    • Configuración del ciclo de vida: configuración del ciclo de vida que especifique el administrador.

    • Adjunte un EFS sistema de archivos personalizado: un Amazon EFS al que su administrador dé acceso.

  10. Selecciona Run space.

  11. Selecciona Abrir JupyterLab.

Configure el espacio

Tras crear un JupyterLab espacio, puede configurarlo para que haga lo siguiente:

  • Cambie el tipo de instancia.

  • Cambie el volumen de almacenamiento.

  • (Se requiere una configuración de administrador) Utilice una imagen personalizada.

  • (Se requiere una configuración de administrador) Utilice una configuración de ciclo de vida.

  • (Se requiere una configuración de administrador) Adjunta un Amazon personalizadoEFS.

importante

Debes detener el JupyterLab espacio cada vez que lo configures. Utilice el siguiente procedimiento para configurar el espacio.

Para configurar un espacio
  1. En Studio, vaya a la página de la JupyterLab aplicación.

  2. Elige el nombre del espacio.

  3. (Opcional) En Imagen, especifique una imagen que haya proporcionado el administrador para personalizar el entorno.

  4. (Opcional) Para la configuración del espacio, especifique lo siguiente:

    • Almacenamiento (GB): hasta 100 GB o la cantidad que el administrador haya configurado para el espacio.

    • Configuración del ciclo de vida: configuración del ciclo de vida que proporciona el administrador.

    • Adjunte un EFS sistema de archivos personalizado: un Amazon EFS al que su administrador dé acceso.

  5. Selecciona Run space.

Al abrir la JupyterLab aplicación, el espacio tiene la configuración actualizada.

Una vez abierto JupyterLab, puede configurar el entorno mediante el terminal. Para abrir el terminal, dirígete al lanzador y selecciona Terminal.

Los siguientes son ejemplos de diferentes formas en las que puede configurar un entorno. JupyterLab

nota

En Studio, puedes usar las configuraciones del ciclo de vida para personalizar tu entorno, pero te recomendamos usar un administrador de paquetes en su lugar. El uso de configuraciones de ciclo de vida es un método más propenso a errores. Es más fácil añadir o eliminar dependencias que depurar un script de configuración del ciclo de vida. También puede aumentar el JupyterLab tiempo de inicio.

Para obtener información sobre las configuraciones del ciclo de vida, consulteUso de configuraciones de ciclo de vida con JupyterLab.

Personalice su entorno mediante un administrador de paquetes

Use pip o conda para personalizar su entorno. Recomendamos usar administradores de paquetes en lugar de scripts de configuración del ciclo de vida.

Cree y active su entorno personalizado

En esta sección se proporcionan ejemplos de las distintas formas en las que puede configurar un entorno JupyterLab.

Un entorno conda básico tiene la cantidad mínima de paquetes que se requieren para sus flujos de trabajo. SageMaker Utilice la siguiente plantilla para crear un entorno conda básico:

# initialize conda for shell interaction conda init # create a new fresh environment conda create --name test-env # check if your new environment is created successfully conda info --envs # activate the new environment conda activate test-env # install packages in your new conda environment conda install pip boto3 pandas ipykernel # list all packages install in your new environment conda list # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # to exit your new environment conda deactivate

La siguiente imagen muestra la ubicación del entorno que ha creado.

El entorno test-env se muestra en la esquina superior derecha de la pantalla.

Para cambiar su entorno, elíjalo y seleccione una opción del menú desplegable.

La marca de verificación y su texto correspondiente muestran un entorno de ejemplo que ha creado anteriormente.

Elija Seleccionar para seleccionar un núcleo para el entorno.

Limpie un entorno conda

Limpiar los entornos conda que no esté utilizando puede ayudar a liberar espacio en disco y mejorar el rendimiento. Utilice la siguiente plantilla para limpiar un entorno conda:

# list your environments to select an environment to clean conda info --envs # or conda info -e # once you've selected your environment to purge conda remove --name test-env --all # run conda environment list to ensure the target environment is purged conda info --envs # or conda info -e

Cree un entorno conda con una versión específica de Python

Limpiar los entornos conda que no esté utilizando puede ayudar a liberar espacio en disco y mejorar el rendimiento. Utilice la siguiente plantilla para limpiar un entorno conda:

# create a conda environment with a specific python version conda create --name py38-test-env python=3.8.10 # activate and test your new python version conda activate py38-test-env & python3 --version # Install ipykernel to facilicate env registration conda install ipykernel # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your py38 test environment conda deactivate

Cree un entorno conda con un conjunto específico de paquetes

Utilice la siguiente plantilla para crear un entorno conda con una versión específica de Python y un conjunto de paquetes:

# prefill your conda environment with a set of packages, conda create --name py38-test-env python=3.8.10 pandas matplotlib=3.7 scipy ipykernel # activate your conda environment and ensure these packages exist conda activate py38-test-env # check if these packages exist conda list | grep -E 'pandas|matplotlib|scipy' # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Clona conda desde un entorno existente

Clona tu entorno conda para conservar su estado de funcionamiento. Experimenta en el entorno clonado sin tener que preocuparse por introducir cambios importantes en su entorno de prueba.

Utilice el siguiente comando para clonar un entorno.

# create a fresh env from a base environment conda create --name py310-base-ext --clone base # replace 'base' with another env # activate your conda environment and ensure these packages exist conda activate py310-base-ext # install ipykernel to register your env conda install ipykernel # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Clona conda desde un archivo de referencia YAML

Cree un entorno conda a partir de un archivo de referenciaYAML. El siguiente es un ejemplo de un YAML archivo que puede utilizar.

# anatomy of a reference environment.yml name: py311-new-env channels: - conda-forge dependencies: - python=3.11 - numpy - pandas - scipy - matplotlib - pip - ipykernel - pip: - git+https://github.com/huggingface/transformers

Enpip, recomendamos especificar solo las dependencias que no están disponibles con conda.

Use los siguientes comandos para crear un entorno conda a partir de un archivo. YAML

# create your conda environment conda create -f environment.yml # activate your env conda activate py311-new-env

Comparta entornos entre tipos de instancias

Puede compartir entornos de conda guardándolos en un EFS directorio de Amazon fuera de su EBS volumen de Amazon. Otro usuario puede acceder al entorno en el directorio en el que lo guardó.

importante

Compartir sus entornos tiene limitaciones. Por ejemplo, no recomendamos un entorno diseñado para ejecutarse en una EC2 instancia de GPU Amazon en lugar de un entorno que se ejecute en una CPU instancia.

Usa los siguientes comandos como plantilla para especificar el directorio de destino en el que vas a crear un entorno personalizado. Está creando una conda dentro de una ruta determinada. Lo creas en el EFS directorio de Amazon. Puedes crear una nueva instancia y hacer la ruta de activación de conda y hacerlo dentro de AmazonEFS.

# if you know your environment path for your conda environment conda create --prefix /home/sagemaker-user/my-project/py39-test python=3.9 # activate the env with full path from prefix conda activate home/sagemaker-user/my-project/py39-test # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | awk -F' : ' '{print $2}' | awk -F'/' '{print $NF}') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env-prefix:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Utilice Amazon Q para agilizar sus flujos de trabajo de Machine Learning

Amazon Q Developer es su compañero con tecnología de IA para el desarrollo del aprendizaje automático. Con Amazon Q Developer, puede:

  • Reciba step-by-step orientación sobre el uso de SageMaker las funciones de forma independiente o en combinación con otros AWS servicios.

  • Obtenga un código de muestra para comenzar con sus tareas de aprendizaje automático, como la preparación de datos, la capacitación, la inferencia yMLOps.

  • Reciba asistencia para la solución de problemas a fin de depurar y resolver los errores encontrados al ejecutar el código. JupyterLab

Amazon Q Developer se integra perfectamente en su JupyterLab entorno. Para utilizar Amazon Q Developer, elija la Q en la barra de navegación de la izquierda de su JupyterLab entorno.

Si no ve el icono Q, significa que el administrador debe configurarlo por usted. Para obtener más información sobre la configuración de Amazon Q Developer, consulteConfigura Amazon Q Developer para tus usuarios.

Amazon Q proporciona automáticamente sugerencias para ayudarte a escribir el código. También puedes pedir sugerencias a través de la interfaz de chat.

Cuando recibas una sugerencia, puedes reemplazar el código de la celda o añadirlo a una nueva celda.