Uso de conjuntos de datos de serie temporal relacionada - Amazon Forecast

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de conjuntos de datos de serie temporal relacionada

Un conjunto de datos de serie temporal relacionada incluye datos de serie temporal que no se incluyen en un conjunto de datos de serie temporal de destino y que podría mejorar la precisión del predictor.

Por ejemplo, en el dominio de previsión de la demanda, un conjunto de datos de serie temporal de destino podría incluir las dimensiones timestamp y item_id, mientras que un conjunto de datos de serie temporal relacionada complementario también incluiría las siguientes características suplementarias: item price, promotion y weather.

Los conjuntos de datos de serie temporal relacionada pueden tener hasta 10 dimensiones de previsión (las mismas del conjunto de datos de serie temporal de destino) y hasta 13 entidades de serie temporal relacionada.

Cuadernos de Python

Para obtener una step-by-step guía sobre el uso de conjuntos de datos de series temporales relacionadas, consulte Incorporación de series temporales relacionadas.

nota

Una serie temporal relacionada que contiene cualquier valor dentro del horizonte de previsión se considera una serie temporal prospectiva.

Las series temporales relacionadas se presentan de dos formas:

  • Series temporales históricas: series temporales sin puntos de datos dentro del horizonte de previsión.

  • Series temporales prospectivas: series temporales con puntos de datos dentro del horizonte de previsión.

Las series temporales históricas relacionadas contienen puntos de datos hasta el horizonte de previsión y no contienen ningún punto de datos dentro del horizonte de previsión. Las series temporales relacionadas prospectivas contienen puntos de datos hasta y dentro del horizonte de previsión.

Un conjunto de datos de serie temporal relacionada tiene las siguientes restricciones:

  • No puede incluir el valor de destino de la serie temporal de destino.

  • Debe incluir las dimensiones item_id y timestamp, y al menos una característica relacionada (por ejemplo, price).

  • Los datos de la característica de serie temporal relacionada deben ser del tipo int o float.

  • Para utilizar la serie temporal de destino completa, todos los artículos del conjunto de datos de series temporales de destino también deben incluirse en el conjunto de datos de series temporales relacionadas. Si una serie temporal relacionada solo contiene un subconjunto de artículos de la serie temporal de destino, la creación del modelo y la generación de previsiones se limitarán a ese subconjunto específico de artículos.

    Por ejemplo, si la serie temporal de destino contiene 1000 artículos y el conjunto de datos de series temporales relacionadas solo contiene 100 artículos, el modelo y las previsiones se basarán únicamente en esos 100 artículos.

  • La frecuencia con la que se registran los datos en el conjunto de datos de serie temporal relacionado debe coincidir con el intervalo en el que desea generar las previsiones (la granularidadde la previsión).

    Por ejemplo, si desea generar previsiones con una granularidad semanal, la frecuencia con la que se registren los datos en las series temporales relacionadas también deberá ser semanal, incluso aunque loa datos se registren en la serie temporal de destino con una frecuencia diaria.

  • Los datos de cada artículo en el conjunto de datos de serie temporal relacionada deben tener una fecha de inicio igual o anterior al comienzo del timestamp del item_id correspondiente en el conjunto de datos de serie temporal de destino.

    Por ejemplo, si los datos de la serie temporal de destino de socks comienzan el 01-01-2019 y los datos de la serie temporal relacionada para shoes comienzan el 01-02-2019, los datos de la serie temporal relacionada para socks deben comenzar el 01-01-2019 o antes y los datos de shoes deben comenzar el 01-02-2019 o antes.

  • En el caso de los conjuntos de datos de series temporales relacionadas prospectivas, la última marca temporal de cada artículo debe coincidir con la última marca temporal del periodo de previsión designado por el usuario (denominado horizonte de previsión).

    En el archivo de serie temporal relacionada de ejemplo siguiente, los datos timestamp de los calcetines y los zapatos deben terminar el 01-07-2019 (la última marca temporal registrada) más el horizonte de previsión. Si la frecuencia de los datos en la serie temporal de destino es diaria y el horizonte de previsión es de 10 días, se deben proporcionar puntos de datos diarios en el archivo de la serie temporal relacionada prospectiva hasta el 11-07-2019.

  • En el caso de los conjuntos de datos de series temporales relacionadas históricas, la última marca temporal de cada artículo debe coincidir con la última marca temporal de la serie temporal de destino.

    En el archivo de serie temporal relacionada de ejemplo siguiente, los datos de timestamp de los calcetines y los zapatos deben terminar el 01/07/2019 (la última marca temporal registrada).

  • Las dimensiones de Forecast proporcionadas en el conjunto de datos de la serie temporal relacionada deben ser iguales o un subconjunto de las dimensiones designadas en el conjunto de datos de la serie temporal de destino.

  • No pueden faltar valores en las series temporales relacionadas. Para obtener más información sobre los valores faltantes en un conjunto de datos de series temporales relacionadas, consulte Gestión de valores faltantes.

En la siguiente tabla se muestra un archivo de conjunto de datos de serie temporal relacionada correctamente configurado. En este ejemplo, suponga lo siguiente:

  • El último punto de datos se registró en el conjunto de datos de serie temporal de destino el 01-07-2019.

  • El horizonte de previsión es de 10 días.

  • La granularidad de la previsión es diaria (D).

Una fila""indica todos los puntos de datos entre las filas anteriores y posteriores.

timestamp item_id store price
2019-01-01 calcetines NYC 10
2019-01-02 calcetines NYC 10
2019-01-03 calcetines NYC 15
...
2019-06-01 calcetines NYC 10
...
2019-07-01 calcetines NYC 10
...
2019-07-11 calcetines NYC 20
2019-01-05 calcetines SFO 45
...
2019-06-05 calcetines SFO 10
...
2019-07-01 calcetines SFO 10
...
2019-07-11 calcetines SFO 30
2019-02-01 zapatos ORD 50
...
2019-07-01 zapatos ORD 75
...
2019-07-11 zapatos ORD 60

En la tabla siguiente, se muestran las frecuencias de registro de datos compatibles con las series temporales de destino y las series temporales relacionadas para realizar previsiones con una granularidad semanal. Dado que los datos de un conjunto de datos de serie temporal relacionada no se pueden agregar, Forecast solo acepta una frecuencia de datos de serie temporal relacionada que sea la misma que la granularidad de la previsión elegida.

Frecuencia de los datos de entrada de destino Frecuencia de las series temporales relacionadas Granularidad de la previsión ¿Compatible con Forecast?
Por día Semanal Semanal
Semanal Semanal Semanal
N/A Semanal Semanal
Por día Por día Semanal No
nota

Para actualizar un predictor existente a, consulte AutoPredictor Actualización a AutoPredictor

Al usar un predictor heredado, puede utilizar un conjunto de datos de serie temporal relacionada al entrenar un predictor con los algoritmos CNN-QR, DeepAR+ y Prophet. NPTS, ARIMA y ETS no aceptan datos de series temporales relacionadas.

En la siguiente tabla se muestran los tipos de series temporales relacionadas que acepta cada algoritmo de Amazon Forecast.

CNN-QR DeepAR+ Prophet NPTS ARIMA ETS

Series temporales relacionadas históricas

Series temporales relacionadas prospectivas

Al utilizar AutoML, puede proporcionar datos de series temporales relacionadas tanto históricas como prospectivas, y Forecast solo utilizará esas series temporales cuando proceda.

Si proporciona datos de series temporales relacionadas prospectivas, Forecast utilizará los datos relacionados con CNN-QR, DeepAR+ y Prophet, y no utilizará los datos relacionados con NPTS, ARIMA y ETS. Si proporciona datos de series temporales relacionadas históricas, Forecast utilizará los datos relacionados con CNN-QR y no utilizará los datos relacionados con DeepAR+, Prophet, NPTS, ARIMA y ETS.