Ejemplos de SageMaker cuadernos Amazon Autopilot - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejemplos de SageMaker cuadernos Amazon Autopilot

Los siguientes cuadernos sirven como ejemplos prácticos y abordan varios casos de uso de Piloto automático.

Puedes encontrar todos los cuadernos de Autopilot en el autopilotdirectorio del repositorio de ejemplos. SageMaker GitHub

Recomendamos clonar todo el repositorio de Git en Studio Classic para acceder a los blocs de notas y ejecutarlos directamente. Para obtener información sobre cómo clonar un repositorio de Git en Studio Classic, consulteClonar un repositorio de Git en SageMaker Studio Classic.

Caso de uso Descripción
Inferencia sin servidor

De forma predeterminada, Piloto automático permite implementar los modelos generados en puntos de conexión de inferencia en tiempo real. En este repositorio, el cuaderno ilustra cómo implementar modelos de Piloto automático entrenados con los modos ENSEMBLING y HYPERPARAMETER OPTIMIZATION (HPO) en puntos de conexión sin servidor. Los puntos de conexión sin servidor lanzan automáticamente los recursos informáticos y los amplían y reducen en función del tráfico, lo que elimina la necesidad de elegir tipos de instancias o de gestionar las políticas de escalado.

Selección de características personalizada

Piloto automático inspecciona su conjunto de datos y ejecuta una serie de candidatos para determinar la combinación óptima de pasos de preprocesamiento de datos, algoritmos de machine learning e hiperparámetros. Puede implementarlos fácilmente en un punto de conexión en tiempo real o para el procesamiento por lotes.

En algunos casos, es posible que desee tener la flexibilidad de llevar el código de procesamiento de datos personalizado a Piloto automático. Por ejemplo, sus conjuntos de datos pueden contener una gran cantidad de variables independientes, y es posible que desee incorporar un paso de selección de características personalizado para eliminar primero las variables irrelevantes. El conjunto de datos más pequeño resultante se puede usar luego para iniciar un trabajo de Piloto automático. En última instancia, también querrá incluir tanto el código de procesamiento personalizado como los modelos de Piloto automático para el procesamiento en tiempo real o por lotes.

Ejemplo de canalización

Si bien Autopilot agiliza el proceso de creación de modelos de aprendizaje automático, los ingenieros de MLOps siguen siendo responsables de crear, automatizar y gestionar end-to-end los flujos de trabajo de aprendizaje automático en la producción. SageMaker Las canalizaciones pueden ayudar a automatizar varios pasos del ciclo de vida del aprendizaje automático, como el preprocesamiento de datos, el entrenamiento de modelos, el ajuste de hiperparámetros, la evaluación de modelos y la implementación. Este cuaderno sirve como demostración de cómo incorporar el Autopilot en un flujo de trabajo de entrenamiento de SageMaker Pipelines end-to-end AutoML. Para lanzar un experimento de Piloto automático en Pipelines, debe crear un flujo de trabajo de creación de modelos escribiendo un código de integración personalizado con pasos de Pipelines, Lambda o Processing. Para obtener más información, consulte Cómo trasladar los modelos de Amazon SageMaker Autopilot ML de la experimentación a la producción con Amazon SageMaker Pipelines.

Como alternativa, cuando utilices el piloto automático en el modo Ensamblar, puedes consultar el ejemplo del cuaderno que demuestra cómo utilizar el paso AutoML nativo en el paso AutoML nativo SageMaker de Pipeline. Gracias a la compatibilidad con Piloto automático como paso nativo en Pipelines, ahora puede añadir un paso de entrenamiento automatizado (AutoMLStep) a su Pipelines e invocar un experimento de Piloto automático en el modo de ensamblaje.

Más cuadernos

Puede encontrar más cuadernos que ilustran otros casos de uso, como batch transform, time-series forecasting y otros en el directorio raíz.