SageMaker Trabajos de cuaderno - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SageMaker Trabajos de cuaderno

Puede usar Amazon SageMaker para crear, entrenar e implementar modelos de aprendizaje automático de forma interactiva desde su cuaderno Jupyter en cualquier entorno. JupyterLab Sin embargo, hay varios escenarios en los que puede que desee ejecutar su cuaderno como un trabajo programado y no interactivo. Por ejemplo, es posible que desee crear informes de auditoría periódicos en los que se analicen todos los trabajos de entrenamiento que se realicen durante un período de tiempo determinado y se analice el valor empresarial de implementar esos modelos en la producción. O tal vez desee ampliar un trabajo de ingeniería de características después de probar la lógica de transformación de datos en un pequeño subconjunto de datos. Los casos de uso habituales incluyen:

  • Programar trabajos para supervisar la desviación del modelo

  • Explorar el espacio de parámetros para obtener mejores modelos

En estos escenarios, puede usar SageMaker Notebook Jobs para crear un trabajo no interactivo (que SageMaker se ejecute como un trabajo de formación subyacente) para ejecutarlo a pedido o según un cronograma. SageMaker Notebook Jobs proporciona una interfaz de usuario intuitiva para que pueda programar sus trabajos directamente desde JupyterLab el widget Notebook Jobs ( Blue icon of a calendar with a checkmark, representing a scheduled task or event. ) de su bloc de notas. También puede programar sus trabajos mediante SageMaker PythonSDK, que ofrece la flexibilidad de programar varios trabajos de cuaderno en un flujo de trabajo en proceso. Puede ejecutar varios cuadernos en paralelo y parametrizar las celdas de los cuadernos para personalizar los parámetros de entrada.

Esta función aprovecha los servicios de Amazon EventBridge, SageMaker Training y Pipelines y está disponible para su uso en su bloc de notas de Jupyter en cualquiera de los siguientes entornos:

  • Instancias Studio, Studio Lab, Studio Classic o Notebook

  • Configuración local, como la máquina local, en la que se ejecuta JupyterLab

Requisitos previos

Para programar un trabajo de cuaderno, asegúrese de que cumple los siguientes criterios:

  • Asegúrese de que su cuaderno de Jupyter y cualquier script de inicialización o inicio sean independientes con respecto al código y los paquetes de software. De lo contrario, el trabajo no interactivo podría incurrir en errores.

  • Compruebe Restricciones y consideraciones para asegurarse de que ha configurado correctamente su cuaderno de Jupyter, la configuración de red y la configuración del contenedor.

  • Asegúrese de que su portátil pueda acceder a los recursos externos necesarios, como los EMR clústeres de Amazon.

  • Si está configurando trabajos del cuaderno en un cuaderno de Jupyter local, complete la instalación. Para obtener instrucciones, consulte Guía de instalación.

  • Si te conectas a un EMR clúster de Amazon en tu bloc de notas y quieres parametrizar tu comando de EMR conexión de Amazon, debes aplicar una solución alternativa utilizando variables de entorno para pasar los parámetros. Para obtener más información, consulte Conéctate a un EMR clúster de Amazon desde tu portátil.

  • Si se conecta a un EMR clúster de Amazon mediante la autenticación Kerberos o HTTP Basic Auth, debe utilizarla AWS Secrets Manager para pasar sus credenciales de seguridad al comando de EMR conexión de Amazon. LDAP Para obtener más información, consulte Conéctate a un EMR clúster de Amazon desde tu portátil.

  • (opcional) Si desea que la interfaz de usuario cargue previamente un script para que se ejecute al iniciar el portátil, el administrador debe instalarlo con una configuración de ciclo de vida (). LCC Para obtener información sobre cómo usar un LCC script, consulte Personalización de una instancia de notebook mediante un script de configuración del ciclo de vida.