Tipos de conjunto de datos y dominios de conjunto de datos predefinidos - Amazon Forecast

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tipos de conjunto de datos y dominios de conjunto de datos predefinidos

Para entrenar un predictor, debe crear uno o más conjuntos de datos para añadirlos a un grupo de conjunto de datos y proporcionar el grupo de conjuntos de datos para el entrenamiento.

A cada conjunto de datos que se crea, se le asocia un dominio y un tipo de conjunto de datos. Un dominio de conjunto de datos especifica un esquema de conjunto de datos predefinido para un caso de uso común y no afecta a los algoritmos de modelo ni a los hiperparámetros.

Amazon Forecast admite los siguientes dominios de conjunto de datos:

Cada dominio puede tener entre uno y tres tipos de conjuntos de datos. Los tipos de conjuntos de datos que crea para un dominio se basan en el tipo de datos que tenga y lo que desee incluir en el entrenamiento.

Cada dominio requiere un conjunto de datos de serie temporal de destino y, opcionalmente, admite los tipos de conjuntos de datos de metadatos de artículo y serie temporal relacionada.

Los tipos de conjuntos de datos incluyen:

  • Serie temporal de destino: el único tipo de conjunto de datos obligatorio. Este tipo define el campo de destino sobre el que desea crear previsiones. Por ejemplo, si desea prever las ventas para un conjunto de productos, debe crear un conjunto de datos de series temporales históricos para cada uno de los productos sobre los que desea realizar la previsión. Del mismo modo, puede crear un conjunto de datos de serie temporal de destino para métricas como, por ejemplo, ingresos, flujo de caja y ventas, sobre los que tal vez desee realizar una previsión.

  • Serie temporal relacionada: datos de series temporales que están relacionados con los datos de la serie temporal de destino. Por ejemplo, el precio está relacionado con los datos de ventas de un producto, por lo que podría proporcionarse como una serie temporal relacionada.

  • Metadatos del artículo: metadatos que se aplican a los datos de la serie temporal de destino. Por ejemplo, si está realizando la previsión de ventas de un producto determinado, los atributos del producto (como marca, color y género) van a formar parte de los metadatos del artículo. Al realizar una previsión de la capacidad de EC2 para instancias EC2, los metadatos podrían incluir la CPU y la memoria de los tipos de instancia.

Para cada tipo de conjunto de datos, los datos de entrada deben contener determinados campos obligatorios. También puede incluir campos opcionales que Amazon Forecast sugiere incluir.

Los siguientes ejemplos muestran cómo elegir un dominio de conjunto de datos y los tipos de conjuntos de datos correspondientes.

ejemplo Ejemplo 1: tipos de conjunto de datos en el dominio RETAIL

Si es un vendedor minorista interesado en la previsión de demanda de artículos, puede crear los siguientes conjuntos de datos en la dominio RETAIL:

  • La serie temporal de destino es el conjunto de datos de la demanda de la serie temporal histórica (ventas) necesario para cada artículo (cada producto que vende un minorista). En el dominio RETAIL, este tipo de conjunto de datos exige que el conjunto de datos incluya los campos item_id, timestamp y demand. El campo demand es el objetivo de la previsión y normalmente es el número de artículos vendidos por el minorista en una semana o día concreto.

  • Opcionalmente, un conjunto de datos del tipo de serie temporal relacionada. En el dominio RETAIL, este tipo puede incluir información de series temporales opcionales, pero sugeridas como price, inventory_onhand y webpage_hits.

  • Opcionalmente, un conjunto de datos del tipo de metadatos de artículo. En el dominio RETAIL, Amazon Forecast sugiere proporcionar información de metadatos relacionados con los artículos proporcionados en la serie temporal de destino, como brand, color, category y genre.

ejemplo Ejemplo 2: tipos de conjunto de datos en el dominio METRICS

Si desea realizar una previsión de las principales métricas para su organización como, por ejemplo, los ingresos, las ventas y el flujo de caja, puede proporcionar a Amazon Forecast los siguientes conjuntos de datos:

  • El conjunto de datos de la serie temporal de destino que proporciona datos históricos de serie temporal para la métrica para la que desea realizar la previsión. Si su objetivo es realizar la previsión de los ingresos de todas las unidades de negocio de su organización, puede crear un conjunto de datos target time series con los campos metric, business unit y metric_value.

  • Si tiene algún metadato para cada métrica que no sea necesario, como category o location, podría proporcionar conjuntos de datos del tipo de serie temporal relacionada y metadatos de artículo.

Como mínimo, debe proporcionar un conjunto de datos de serie temporal de destino para que Forecast pueda generar las previsiones de las métricas de destino.

ejemplo Ejemplo 3: tipos de conjunto de datos en el dominio CUSTOM

Los datos de entrenamiento para su aplicación de previsión no encajan en ningún dominio de Amazon Forecast. Si ese es el caso, elija el dominio CUSTOM. Debe proporcionar el conjunto de datos de serie temporal de destino, pero puede añadir sus propios campos personalizados.

El ejercicio Introducción realiza una previsión del uso de electricidad para un cliente. Los datos de entrenamiento del uso de electricidad no encajan en ninguno de los dominios de conjuntos de datos, por lo que hemos usado el dominio CUSTOM. En el ejercicio, solo utilizamos un único tipo de conjunto de datos, el tipo de serie temporal de destino. Asignamos los campos de datos a los campos mínimos requeridos por el tipo de conjunto de datos.