Pronósticos de series temporales en Amazon SageMaker Canvas - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Pronósticos de series temporales en Amazon SageMaker Canvas

nota

Los modelos de previsión de series temporales solo se admiten para conjuntos de datos tabulares.

Amazon SageMaker Canvas le permite utilizar pronósticos de series temporales de aprendizaje automático. Las previsiones de series temporales le permiten realizar predicciones que pueden variar con el tiempo.

Puede hacer una previsión de series temporales para los siguientes ejemplos:

  • Previsión del inventario para los próximos meses.

  • Cantidad de artículos vendidos en los próximos cuatro meses.

  • Efecto de reducir el precio en las ventas durante la temporada navideña.

  • Inventario de artículos en los próximos 12 meses.

  • Número de clientes que entrarán en una tienda en las próximas horas.

  • Predicción de cómo afecta una reducción del 10 % en el precio de un producto a las ventas durante un período de tiempo.

Para realizar una previsión de series temporales, el conjunto de datos debe tener lo siguiente:

  • Una columna de fecha y hora con todos los valores del tipo datetime.

  • Una columna de destino que contenga los valores que se utilizan para pronosticar valores futuros.

  • Una columna de ID de elemento que contiene identificadores únicos para cada elemento del conjunto de datos, como SKU números.

Los valores datetime de la columna de marca temporal deben usar uno de los siguientes formatos:

  • YYYY-MM-DD HH:MM:SS

  • YYYY-MM-DDTHH:MM:SSZ

  • YYYY-MM-DD

  • MM/DD/YY

  • MM/DD/YY HH:MM

  • MM/DD/YYYY

  • YYYY/MM/DD HH:MM:SS

  • YYYY/MM/DD

  • DD/MM/YYYY

  • DD/MM/YY

  • DD-MM-YY

  • DD-MM-YYYY

Puede realizar previsiones para los siguientes intervalos:

  • 1 min

  • 5 min

  • 15 min

  • 30 min

  • 1 hora

  • 1 día

  • 1 semana

  • 1 mes

  • 1 año

Valores futuros en su conjunto de datos de entrada

Canvas detecta automáticamente las columnas de su conjunto de datos que podrían contener valores futuros. Si están presentes, estos valores pueden mejorar la precisión de las predicciones. Canvas marca estas columnas específicas con una etiqueta Future values. Canvas deduce la relación entre los datos de estas columnas y la columna de destino que está intentando predecir y utiliza esa relación para generar previsiones más precisas.

Por ejemplo, puede prever la cantidad de helado que venderá una tienda de comestibles. Para hacer una previsión, debe tener una columna de fecha y hora y una columna que indique la cantidad de helado que vendió la tienda. Para obtener una previsión más precisa, su conjunto de datos también puede incluir el precio, la temperatura ambiente, el sabor del helado o un identificador único del helado.

Las ventas de helados pueden aumentar cuando el clima es más cálido. Una disminución en el precio del helado podría provocar la venta de más unidades. Tener una columna con datos de temperatura ambiente y otra con datos de precios puede mejorar la capacidad de pronosticar el número de unidades de helado que vende la tienda de comestibles.

Si bien proporcionar valores futuros es opcional, le ayuda a realizar análisis hipotéticos directamente en la aplicación de Canvas, lo que le muestra cómo los cambios en los valores futuros podrían alterar sus predicciones.

Gestión de valores faltantes

Es posible que le falten datos por diferentes motivos. El motivo de la falta de datos podría indicar cómo quiere que Canvas los impute. Por ejemplo, su organización podría usar un sistema automático que solo registre cuándo se produce una venta. Si utiliza un conjunto de datos que provenga de este tipo de sistema automático, tendrá valores faltantes en la columna de destino.

importante

Si faltan valores en la columna de destino, te recomendamos que utilices un conjunto de datos que no los contenga. SageMaker Canvas usa la columna objetivo para pronosticar valores futuros. Los valores faltantes en la columna de destino pueden reducir considerablemente la precisión de la previsión.

En el caso de los valores faltantes en el conjunto de datos, Canvas imputa automáticamente los valores faltantes rellenando la columna de destino con 0 y otras columnas numéricas con el valor de la mediana de la columna.

Sin embargo, puede seleccionar su propia lógica de rellenado para la columna de destino y otras columnas numéricas de sus conjuntos de datos. Las columnas de destino tienen pautas y restricciones de llenado diferentes a las del resto de las columnas numéricas. Las columnas de destino se rellenan hasta el final del período histórico, mientras que las columnas numéricas se rellenan tanto para los períodos históricos como para los futuros hasta el final del horizonte de previsión. Canvas solo rellena los valores futuros en una columna numérica si sus datos tienen al menos un registro con una marca de tiempo futura y un valor para esa columna específica.

Puede elegir una de las siguientes opciones de lógica de rellenado para imputar valores faltantes en sus datos:

  • zero: rellenar con 0.

  • NaN: rellenar con NaN o no con un número. Esto solo se admite en la columna de destino.

  • mean: rellenar con el valor medio de la serie de datos.

  • median: rellenar con el valor mediano de la serie de datos.

  • min: rellenar con el valor mínimo de la serie de datos.

  • max: rellenar con el valor máximo de la serie de datos.

Al elegir una lógica de rellenado, debe considerar cómo interpretará su modelo la lógica. Por ejemplo, en un caso comercial, registrar cero ventas de un artículo disponible es diferente de registrar cero ventas de un artículo no disponible, ya que este último caso no implica necesariamente una falta de interés del cliente en el artículo no disponible. En este caso, rellenar con 0 en la columna de destino del conjunto de datos podría provocar que el modelo no tenga un sesgo suficiente en sus predicciones y deducir una falta de interés de los clientes por los artículos no disponibles. Por el contrario, rellenar con NaN podría provocar que el modelo ignore los casos reales en los que no se venda ningún artículo de los artículos disponibles.

Tipos de previsiones

Puede realizar uno de los siguientes tipos de previsiones:

  • Elemento único

  • Todos los elementos

Para obtener una previsión de todos los elementos de su conjunto de datos, SageMaker Canvas devuelve una previsión de los valores futuros de cada elemento de su conjunto de datos.

Para una previsión de un solo elemento, usted especifica el elemento y SageMaker Canvas devuelve una previsión para los valores futuros. La previsión incluye un gráfico lineal que traza los valores pronosticados a lo largo del tiempo.