Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
SageMaker Piloto automático
importante
A partir del 30 de noviembre de 2023, la interfaz de usuario de Autopilot migrará a Amazon SageMaker Canvas como parte de la experiencia actualizada de Amazon SageMaker Studio. SageMaker Canvas proporciona a los analistas y científicos de datos ciudadanos funciones sin necesidad de programar para tareas como la preparación de datos, la ingeniería de funciones, la selección de algoritmos, la formación y el ajuste, la inferencia y mucho más. Los usuarios pueden aprovechar las visualizaciones integradas y el análisis hipotético para explorar sus datos y diferentes escenarios, con predicciones automatizadas que les permiten poner en producción sus modelos con facilidad. Canvas admite una variedad de casos de uso, como la visión artificial, la previsión de la demanda, la búsqueda inteligente y la IA generativa.
Los usuarios de Amazon SageMaker Studio Classic, la experiencia anterior de Studio, pueden seguir utilizando la interfaz de usuario del piloto automático en Studio Classic. Los usuarios con experiencia en codificación pueden seguir utilizando todas las referencias de la API en cualquier SDK admitido para la implementación técnica.
Si ha utilizado el piloto automático en Studio Classic hasta ahora y quiere migrar a SageMaker Canvas, puede que tenga que conceder permisos adicionales a su perfil de usuario o función de IAM para poder crear y utilizar la SageMaker aplicación Canvas. Para obtener más información, consulte (Opcional) Migre del piloto automático de Studio Classic a Canvas SageMaker .
Todas las instrucciones relacionadas con la interfaz de usuario de esta guía se refieren a las funciones independientes de Autopilot antes de migrar a Amazon Canvas. SageMaker Los usuarios que sigan estas instrucciones deben usar Studio Classic.
Amazon SageMaker Autopilot es un conjunto de funciones que simplifica y acelera varias etapas del flujo de trabajo de aprendizaje automático al automatizar el proceso de creación e implementación de modelos de aprendizaje automático (AutoML). En la siguiente página se explica la información clave sobre Amazon SageMaker Autopilot.
Piloto automático realiza las siguientes tareas clave que puede utilizar en modo piloto automático o con distintos grados de orientación humana:
-
Análisis y preprocesamiento de datos: Piloto automático identifica el tipo de problema específico, gestiona los valores que faltan, normaliza los datos, selecciona las características y prepara en general los datos para el entrenamiento del modelo.
-
Selección del modelo: Piloto automático explora una variedad de algoritmos y utiliza una técnica de remuestreo con validación cruzada para generar métricas que evalúen la calidad predictiva de los algoritmos en función de métricas objetivas predefinidas.
-
Optimización de hiperparámetros: Piloto automático automatiza la búsqueda de configuraciones de hiperparámetros óptimas.
-
Evaluación y entrenamiento de modelos: Piloto automático automatiza el proceso de entrenamiento y evaluación de varios modelos candidatos. Divide los datos en conjuntos de entrenamiento y validación, entrena a los candidatos a modelo seleccionados utilizando los datos de entrenamiento y evalúa el rendimiento sobre los datos no observados del conjunto de validación. Por último, clasifica los candidatos a modelo optimizados en función de su rendimiento e identifica el modelo con mejor rendimiento.
-
Implementación del modelo: cuando Piloto automático ya ha identificado el modelo con mejor rendimiento, ofrece la opción de implementar el modelo automáticamente generando los artefactos del modelo y el punto de conexión que revelan una API. Las aplicaciones externas pueden enviar datos al punto de conexión y recibir las predicciones o inferencias correspondientes.
El piloto automático permite crear modelos de aprendizaje automático en conjuntos de datos grandes de hasta cientos de. GBs
En el siguiente diagrama se describen las tareas de este proceso de AutoML administrado por Piloto automático.

En función de su nivel de comodidad con el proceso de machine learning y de su experiencia en programación, puede utilizar Piloto automático de diferentes maneras:
-
Con la interfaz de usuario de Studio Classic, los usuarios pueden elegir entre una experiencia sin código o contar con cierto nivel de intervención humana.
nota
A través de la interfaz de usuario de Studio Classic, solo están disponibles los experimentos creados a partir de datos tabulares para tipos de problemas como la regresión o la clasificación.
-
Con la API de AutoML, los usuarios con experiencia en codificación pueden utilizar las disponibles SDKs para crear trabajos de AutoML. Este método proporciona una mayor flexibilidad y opciones de personalización y está disponible para todos los tipos de problemas.
Actualmente, Autopilot es compatible con los siguientes tipos de problemas:
nota
Para los problemas de regresión o clasificación relacionados con datos tabulares, los usuarios pueden elegir entre dos opciones: utilizar la interfaz de usuario de Studio Classic o la referencia de las API.
Las tareas como la clasificación de textos e imágenes, la previsión de series temporales y el afinamiento de modelos de lenguaje grandes están disponibles exclusivamente en la versión 2 de la API de REST de AutoML. Si su idioma preferido es Python, puede consultar directamente el MLV2 objeto Auto
Los usuarios que prefieran la comodidad de una interfaz de usuario pueden usar Amazon SageMaker Canvas para acceder a modelos previamente entrenados y modelos básicos de IA generativa, o crear modelos personalizados adaptados a textos específicos, clasificación de imágenes, necesidades de previsión o IA generativa.
-
Clasificación por regresión, binaria y multiclase, con datos tabulares formateados como archivos CSV o Parquet en los que cada columna contiene una característica con un tipo de datos específico y cada fila contiene una observación. Algunos tipos de datos de columna aceptados son series numéricas, categóricas, de texto y temporales compuestas por cadenas de números separados por comas.
-
Para crear un trabajo de piloto automático como experimento piloto utilizando la referencia de la SageMaker API, consulte. Creación de trabajos de regresión o clasificación para datos tabulares mediante la API de AutoML
-
Para crear un trabajo de Piloto automático como experimento piloto mediante la interfaz de usuario de Studio Classic, consulte Creación de un experimento de Piloto automático de regresión o clasificación para datos tabulares usando la interfaz de usuario de Studio Classic.
-
Si es administrador y desea preconfigurar los parámetros predeterminados de infraestructura, red o seguridad de los experimentos de Piloto automático en la interfaz de usuario de Studio Classic, consulte Configurar los parámetros predeterminados de un experimento de Piloto automático (para administradores).
-
-
Clasificación de texto con datos formateados como archivos CSV o Parquet, en los que una columna contiene las frases que se van a clasificar y otra columna debe incluir la etiqueta de clase correspondiente. Consulte Creación de un trabajo de AutoML de clasificación de texto mediante la API.
-
Clasificación de imágenes con formatos de imagen como PNG, JPEG o una combinación de ambos. Consulte Creación de un trabajo de clasificación de imágenes mediante la API de AutoML.
-
Previsión de series temporales con datos de serie temporal formateados como archivos CSV o Parquet. Consulte Creación de un trabajo de AutoML para la previsión de serie temporal con la API.
-
Ajuste preciso de modelos de lenguaje de gran tamaño (LLMs) para la generación de texto con datos formateados como archivos CSV o Parquet. Consulte. Creación de un trabajo de AutoML para afinar modelos de generación de texto mediante la API
Además, Piloto automático ayuda a los usuarios a entender cómo hacen predicciones los modelos mediante la generación automática de informes que muestran la importancia de cada característica individual. Esto proporciona transparencia e información sobre los factores que influyen en las predicciones, algo que pueden utilizar los equipos de riesgo y cumplimiento y los reguladores externos. Piloto automático también proporciona un informe de rendimiento del modelo, que incluye un resumen de las métricas de evaluación, una matriz de confusión, diversas visualizaciones, como las curvas características del funcionamiento del receptor y las curvas de recuperación de precisión, etc. El contenido específico de cada informe varía según el tipo de problema del experimento con Piloto automático.
Los informes de explicabilidad y rendimiento del mejo candidato a modelo en un experimento de Piloto automático están disponibles para los tipos de problemas de clasificación de texto, imagen y datos tabulares.
En los casos de uso de datos tabulares, como la regresión o la clasificación, Piloto automático ofrece visibilidad adicional sobre cómo se clasificaron los datos y cómo se seleccionaron, entrenaron y ajustaron los candidatos; esto se logra generando cuadernos que contienen el código utilizado para explorar los datos y encontrar el modelo con el mejor rendimiento. Estos cuadernos proporcionan un entorno interactivo y exploratorio que le ayuda a conocer el impacto de las distintas entradas, o las ventajas y desventajas que se obtienen en los experimentos. Puede seguir experimentando con el modelo candidato de mayor rendimiento mediante sus propias modificaciones en los cuadernos de exploración de datos y de definición de candidatos proporcionados por Autopilot.
Con Amazon SageMaker AI, solo pagas por lo que usas. Usted paga por los recursos informáticos y de almacenamiento subyacentes de la SageMaker IA u otros AWS servicios, en función del uso que haga. Para obtener más información sobre el coste del uso de la SageMaker IA, consulta los precios de Amazon SageMaker AI
Temas
Creación de trabajos de regresión o clasificación para datos tabulares mediante la API de AutoML
Creación de un trabajo de clasificación de imágenes mediante la API de AutoML
Creación de un trabajo de AutoML de clasificación de texto mediante la API
Creación de un trabajo de AutoML para la previsión de serie temporal con la API
Creación de un trabajo de AutoML para afinar modelos de generación de texto mediante la API
Vídeos: Uso de Piloto automático para automatizar y explorar el proceso de machine learning