Configuraciones avanzadas de creación de modelos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuraciones avanzadas de creación de modelos

Amazon SageMaker Canvas admite varios ajustes avanzados que puede configurar al crear un modelo. En la siguiente página se enumeran todos los ajustes avanzados junto con información adicional sobre sus opciones y configuraciones.

nota

Actualmente, las siguientes configuraciones avanzadas solo se admiten para los tipos de modelos de previsión numéricos, categóricos y de series temporales.

Configuración avanzada del modelo de predicción numérica y categórica

Canvas admite las siguientes configuraciones avanzadas para los tipos de modelos de predicción numérica y categórica.

Métrica objetiva

La métrica objetivo es la métrica que desea que Canvas optimice al crear su modelo. Si no selecciona una métrica, Canvas elegirá una por defecto. Para obtener descripciones de las métricas disponibles, consulte laReferencia de métricas.

Método de entrenamiento

Canvas puede seleccionar automáticamente el método de entrenamiento en función del tamaño del conjunto de datos, o puede seleccionarlo manualmente. Puede elegir entre los siguientes métodos de entrenamiento:

  • Ensamblaje: SageMaker aprovecha la AutoGluon biblioteca para entrenar varios modelos básicos. Para encontrar la mejor combinación para su conjunto de datos, el modo conjunto ejecuta de 5 a 10 ensayos con diferentes ajustes de modelo y metacametámetro. A continuación, estos modelos se combinan mediante un método de apilamiento por conjuntos para crear un modelo predictivo óptimo. Para obtener una lista de los algoritmos compatibles con el modo de conjunto para datos tabulares, consulte la siguiente Algoritmos sección.

  • Optimización de hiperparámetros (HPO): SageMaker busca la mejor versión de un modelo ajustando los hiperparámetros mediante la optimización bayesiana o la optimización de multifidelidad mientras ejecuta tareas de entrenamiento en el conjunto de datos. El modo HPO selecciona los algoritmos que son más relevantes para el conjunto de datos y selecciona el mejor rango de hiperparámetros para ajustar los modelos. Para ajustar sus modelos, el modo HPO ejecuta hasta 100 pruebas (predeterminado) para encontrar la configuración de hiperparámetros óptima dentro del rango seleccionado. Si el tamaño del conjunto de datos es inferior a 100 MB, utiliza la optimización bayesiana. SageMaker SageMaker elige la optimización de multifidelidad si el conjunto de datos tiene más de 100 MB.

    Para obtener una lista de los algoritmos compatibles con el modo HPO para datos tabulares, consulte la siguiente sección. Algoritmos

  • Automático: elige SageMaker automáticamente el modo de ensamblaje o el modo HPO en función del tamaño del conjunto de datos. Si el conjunto de datos ocupa más de 100 MB, SageMaker elige el modo HPO. De lo contrario, elige el modo de ensamblaje.

Algoritmos

En el modo de ensamblaje, Canvas admite los siguientes algoritmos de aprendizaje automático:

  • LightGBM: un marco optimizado que utiliza algoritmos basados en árboles con potenciación por gradiente. Este algoritmo utiliza árboles que crecen en amplitud, en lugar de en profundidad, y está altamente optimizado para la velocidad.

  • CatBoost— Un marco que utiliza algoritmos basados en árboles con aumento de gradiente. Optimizado para la gestión de variables categóricas.

  • XGBoost: un marco que utiliza algoritmos basados en árboles con potenciación por gradiente que aumenta en profundidad, en lugar de amplitud.

  • Random Forest: algoritmo basado en árboles que utiliza varios árboles de decisión en submuestras aleatorias de los datos y las reemplaza. Los árboles se dividen en nodos óptimos en cada nivel. Las decisiones de cada árbol se promedian para evitar el sobreajuste y mejorar las predicciones.

  • Extra Trees: un algoritmo basado en árboles que utiliza varios árboles de decisión en todo el conjunto de datos. Los árboles se dividen aleatoriamente en cada nivel. Las decisiones de cada árbol se promedian para evitar el sobreajuste y mejorar las predicciones. Extra Trees añade un grado de asignación al azar en comparación con el algoritmo Random Forest.

  • Linear Models: un marco que utiliza una ecuación lineal para modelar la relación entre dos variables en los datos observados.

  • Neural network torch: un modelo de red neuronal que se implementa con Pytorch.

  • Neural network fast.ai: un modelo de red neuronal que se implementa con fast.ai.

En el modo HPO, Canvas admite los siguientes algoritmos de aprendizaje automático:

  • XGBoost: un algoritmo de aprendizaje supervisado que intenta predecir de forma apropiada una variable objetivo mediante la combinación de un conjunto de estimaciones a partir de un conjunto de modelos más simples y más débiles.

  • Algoritmo de aprendizaje profundo: un perceptrón multicapa (MLP) y una red neuronal artificial de retroalimentación. Este algoritmo puede procesar datos que no se pueden separar linealmente.

División de datos

Tiene la opción de especificar cómo quiere dividir el conjunto de datos entre el conjunto de entrenamiento (la parte del conjunto de datos que se utiliza para crear el modelo) y el conjunto de validación (la parte del conjunto de datos que se utiliza para verificar la precisión del modelo). Por ejemplo, una proporción de división común es el 80% de entrenamiento y el 20% de validación, donde el 80% de los datos se utilizan para crear el modelo y el 20% se guarda para medir el rendimiento del modelo. Si no especifica una proporción personalizada, Canvas divide el conjunto de datos automáticamente.

Número máximo de candidatos

nota

Esta función solo está disponible en el modo de formación HPO.

Puede especificar el número máximo de modelos candidatos que Canvas generará al crear su modelo. Le recomendamos que utilice el número predeterminado de candidatos, que es 100, para crear los modelos más precisos. El número máximo que puede especificar es 250. Disminuir el número de modelos candidatos puede afectar a la precisión de su modelo.

Máximo tiempo de ejecución del trabajo

Puede especificar el tiempo máximo de ejecución del trabajo o el tiempo máximo que Canvas dedica a crear su modelo. Una vez transcurrido el límite de tiempo, Canvas deja de crear y selecciona el mejor modelo candidato.

El tiempo máximo que puede especificar es de 720 horas. Le recomendamos encarecidamente que mantenga el tiempo máximo de ejecución del trabajo en más de 30 minutos para garantizar que Canvas tenga tiempo suficiente para generar modelos candidatos y terminar de crear su modelo.

Configuración avanzada del modelo de previsión de series temporales

Para los modelos de previsión de series temporales, Canvas admite la métrica Objective, que se detalla en la sección anterior.

Los modelos de previsión de series temporales también admiten la siguiente configuración avanzada:

Selección de algoritmos

Al crear un modelo de pronóstico de series temporales, Canvas utiliza un conjunto (o una combinación) de algoritmos estadísticos y de aprendizaje automático para ofrecer pronósticos de series temporales de alta precisión. De forma predeterminada, Canvas selecciona la combinación óptima de todos los algoritmos disponibles en función de las series temporales de su conjunto de datos. Sin embargo, tiene la opción de especificar uno o más algoritmos para usarlos en su modelo de pronóstico. En este caso, Canvas determina la mejor combinación utilizando solo los algoritmos seleccionados. Si no está seguro de qué algoritmo seleccionar para entrenar su modelo, le recomendamos que elija todos los algoritmos disponibles.

nota

La selección de algoritmos solo se admite en las compilaciones estándar. Si no seleccionas ningún algoritmo en la configuración avanzada, de forma predeterminada, SageMaker ejecuta una compilación rápida y entrena a los modelos candidatos mediante un único algoritmo de aprendizaje basado en árboles. Para obtener más información sobre la diferencia entre compilaciones rápidas y compilaciones estándar, consulteCreación de un modelo personalizado.

Canvas admite los siguientes algoritmos de previsión de series temporales:

  • Media móvil integrada autorregresiva (ARIMA): un modelo estocástico simple de series temporales que utiliza el análisis estadístico para interpretar los datos y hacer predicciones futuras. Este algoritmo es útil para conjuntos de datos simples con menos de 100 series temporales.

  • Red neuronal convolucional: regresión cuantil (CNN-QR): algoritmo de aprendizaje supervisado patentado que entrena un modelo global a partir de una gran colección de series temporales y utiliza un decodificador de cuantiles para hacer predicciones. CNN-QR funciona mejor con conjuntos de datos grandes que contienen cientos de series temporales.

  • DeepAr+: un algoritmo de aprendizaje supervisado patentado para pronosticar series temporales escalares mediante redes neuronales recurrentes (RNN) para entrenar un único modelo de forma conjunta en todas las series temporales. DeepAR+ funciona mejor con conjuntos de datos grandes que contienen cientos de series temporales de características.

  • Series temporales no paramétricas (NPTS): un pronosticador de referencia probabilístico y escalable que predice la distribución del valor futuro de una serie temporal determinada mediante el muestreo de observaciones pasadas. El NPTS resulta útil cuando se trabaja con series temporales dispersas o intermitentes (por ejemplo, para pronosticar la demanda de elementos individuales en los que la serie temporal tiene muchos ceros o recuentos bajos).

  • Suavización exponencial (ETS): método de pronóstico que produce pronósticos que son promedios ponderados de observaciones anteriores, en los que los pesos de las observaciones más antiguas disminuyen exponencialmente. El algoritmo es útil para conjuntos de datos simples con menos de 100 series temporales y conjuntos de datos con patrones de estacionalidad.

  • Prophet: un modelo de regresión aditiva que funciona mejor con series temporales que tienen fuertes efectos estacionales y con varias temporadas de datos históricos. El algoritmo es útil para conjuntos de datos con tendencias de crecimiento no lineales que se acercan a un límite.

Cuantiles de pronóstico

Para la previsión de series temporales, SageMaker entrena a 6 candidatos modelo con su serie temporal objetivo. A continuación, SageMaker combina estos modelos mediante un método de apilamiento por conjuntos para crear un modelo de pronóstico óptimo para una métrica objetivo determinada. Cada modelo de pronóstico genera un pronóstico probabilístico al producir pronósticos en cuantiles entre P1 y P99. Estos cuantiles se utilizan para contabilizar la incertidumbre de las previsiones. De forma predeterminada, las previsiones se generan para 0.1 (p10), 0.5 () y 0.9 (p50). p90 Puede elegir especificar hasta cinco cuantiles propios, entre 0.01 (p1) y 0.99 (), con incrementos de 0.01 (p99) o más.