Tipos de conjunto de datos y dominios de conjunto de datos predefinidos - Amazon Forecast

Amazon Forecast ya no está disponible para nuevos clientes. Los clientes actuales de Amazon Forecast pueden seguir utilizando el servicio con normalidad. Más información

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tipos de conjunto de datos y dominios de conjunto de datos predefinidos

Para entrenar un predictor, debe crear uno o más conjuntos de datos para añadirlos a un grupo de conjunto de datos y proporcionar el grupo de conjuntos de datos para el entrenamiento.

A cada conjunto de datos que se crea, se le asocia un dominio y un tipo de conjunto de datos. Un dominio de conjunto de datos especifica un esquema de conjunto de datos predefinido para un caso de uso común y no afecta a los algoritmos de modelo ni a los hiperparámetros.

Amazon Forecast admite los siguientes dominios de conjunto de datos:

Cada dominio puede tener entre uno y tres tipos de conjuntos de datos. Los tipos de conjuntos de datos que crea para un dominio se basan en el tipo de datos que tenga y lo que desee incluir en el entrenamiento.

Cada dominio requiere un conjunto de datos de serie temporal de destino y, opcionalmente, admite los tipos de conjuntos de datos de metadatos de artículo y serie temporal relacionada.

Los tipos de conjuntos de datos incluyen:

  • Serie temporal de destino: el único tipo de conjunto de datos obligatorio. Este tipo define el campo de destino sobre el que desea crear previsiones. Por ejemplo, si desea prever las ventas para un conjunto de productos, debe crear un conjunto de datos de series temporales históricos para cada uno de los productos sobre los que desea realizar la previsión. Del mismo modo, puede crear un conjunto de datos de serie temporal de destino para métricas como, por ejemplo, ingresos, flujo de caja y ventas, sobre los que tal vez desee realizar una previsión.

  • Serie temporal relacionada: datos de series temporales que están relacionados con los datos de la serie temporal de destino. Por ejemplo, el precio está relacionado con los datos de ventas de un producto, por lo que podría proporcionarse como una serie temporal relacionada.

  • Metadatos del artículo: metadatos que se aplican a los datos de la serie temporal de destino. Por ejemplo, si está realizando la previsión de ventas de un producto determinado, los atributos del producto (como marca, color y género) van a formar parte de los metadatos del artículo. Al predecir la EC2 capacidad de las EC2 instancias, los metadatos pueden incluir la memoria CPU y la memoria de los tipos de instancia.

Para cada tipo de conjunto de datos, los datos de entrada deben contener determinados campos obligatorios. También puede incluir campos opcionales que Amazon Forecast sugiere incluir.

Los siguientes ejemplos muestran cómo elegir un dominio de conjunto de datos y los tipos de conjuntos de datos correspondientes.

ejemplo Ejemplo 1: Tipos de conjuntos de datos en el dominio RETAIL

Si es un minorista interesado en pronosticar la demanda de artículos, puede crear los siguientes conjuntos de datos en el RETAIL dominio:

  • La serie temporal de destino es el conjunto de datos de la demanda de la serie temporal histórica (ventas) necesario para cada artículo (cada producto que vende un minorista). En el RETAIL dominio, este tipo de conjunto de datos requiere que el conjunto de datos incluya los timestamp campositem_id, y. demand El campo demand es el objetivo de la previsión y normalmente es el número de artículos vendidos por el minorista en una semana o día concreto.

  • Opcionalmente, un conjunto de datos del tipo de serie temporal relacionada. En el RETAIL dominio, este tipo puede incluir información de series temporales opcional, pero sugeridaprice, comoinventory_onhand, ywebpage_hits.

  • Opcionalmente, un conjunto de datos del tipo de metadatos de artículo. En el RETAIL dominio, Amazon Forecast sugiere proporcionar información de metadatos relacionada con los elementos que proporcionó en las series temporales objetivobrand, comocolor,category, ygenre.

ejemplo Ejemplo 2: Tipos de conjuntos de datos del METRICS dominio

Si desea realizar una previsión de las principales métricas para su organización como, por ejemplo, los ingresos, las ventas y el flujo de caja, puede proporcionar a Amazon Forecast los siguientes conjuntos de datos:

  • El conjunto de datos de la serie temporal de destino que proporciona datos históricos de serie temporal para la métrica para la que desea realizar la previsión. Si su objetivo es realizar la previsión de los ingresos de todas las unidades de negocio de su organización, puede crear un conjunto de datos target time series con los campos metric, business unit y metric_value.

  • Si tiene algún metadato para cada métrica que no sea necesario, como category o location, podría proporcionar conjuntos de datos del tipo de serie temporal relacionada y metadatos de artículo.

Como mínimo, debe proporcionar un conjunto de datos de serie temporal de destino para que Forecast pueda generar las previsiones de las métricas de destino.

ejemplo Ejemplo 3: Tipos de conjuntos de datos en el CUSTOM dominio

Los datos de entrenamiento para su aplicación de previsión no encajan en ningún dominio de Amazon Forecast. Si ese es el caso, elija el CUSTOM dominio. Debe proporcionar el conjunto de datos de serie temporal de destino, pero puede añadir sus propios campos personalizados.

El ejercicio Introducción realiza una previsión del uso de electricidad para un cliente. Los datos de entrenamiento sobre el consumo de electricidad no caben en ninguno de los dominios del conjunto de datos, por lo que utilizamos el CUSTOM dominio. En el ejercicio, solo utilizamos un único tipo de conjunto de datos, el tipo de serie temporal de destino. Asignamos los campos de datos a los campos mínimos requeridos por el tipo de conjunto de datos.