Usar conjuntos de dados de séries temporais relacionadas - Amazon Forecast

O Amazon Forecast não está mais disponível para novos clientes. Os clientes existentes do Amazon Forecast podem continuar usando o serviço normalmente. Saiba mais

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usar conjuntos de dados de séries temporais relacionadas

Um conjunto de dados de séries temporais relacionadas inclui dados de séries temporais que não estão incluídos em um conjunto de dados de séries temporais de destino e podem melhorar a precisão do preditor.

Por exemplo, no domínio de previsão de demanda, um conjunto de dados de séries temporais de destino conteria as dimensões timestamp e item_id, enquanto um conjunto de dados de séries temporais relacionadas complementar também inclui os seguintes recursos complementares: item price, promotion e weather.

Um conjunto de dados de séries temporais relacionadas pode conter até 10 dimensões de previsão (as mesmas do conjunto de dados de séries temporais de destino) e até 13 recursos de séries temporais relacionadas.

Cadernos Python

Para obter um step-by-step guia sobre o uso de conjuntos de dados de séries temporais relacionadas, consulte Incorporando séries temporais relacionadas.

nota

Uma série temporal relacionada que contém quaisquer valores no horizonte de previsão é tratada como uma série temporal prospectiva.

As séries temporais relacionadas são fornecidas de duas formas:

  • Séries temporais históricas: séries temporais sem pontos de dados no horizonte de previsão.

  • Séries temporais prospectivas: séries temporais com pontos de dados no horizonte de previsão.

As séries temporais históricas relacionadas contêm pontos de dados até o horizonte de previsão e não contêm nenhum ponto de dados no horizonte de previsão. As séries temporais prospectivas relacionadas contêm pontos de dados até o horizonte de previsão e dentro dele.

Time series graph showing target, forward-looking, and historical related data with forecast window.

Um conjunto de dados de séries temporais relacionadas tem as seguintes restrições:

  • Ele não pode incluir o valor de destino da série temporal de destino.

  • Ele deve incluir as dimensões item_id e timestamp, e pelo menos um recurso relacionado (como price).

  • Os dados do recurso de séries temporais relacionadas devem ser dos tipos de dados int ou float.

  • Para usar toda a série temporal de destino, todos os itens do conjunto de dados de séries temporais de destino também devem ser incluídos no conjunto de dados de séries temporais relacionadas. Se uma série temporal relacionada contiver apenas um subconjunto de itens da série temporal de destino, a criação do modelo e a geração da previsão serão limitadas a esse subconjunto específico de itens.

    Por exemplo, se a série temporal de destino contiver 1.000 itens e o conjunto de dados de séries temporais relacionadas contiver apenas 100 itens, o modelo e as previsões se basearão somente nesses 100 itens.

  • A frequência na qual os dados são registrados no conjunto de dados de séries temporais relacionadas deve corresponder ao intervalo no qual você deseja gerar previsões (a granularidade de previsão).

    Por exemplo, se você quiser gerar previsões em uma granularidade semanal, a frequência na qual os dados são registrados na série temporal relacionada também deve ser semanal, ainda que a frequência na qual os dados são registrados na série temporal de destino seja diária.

  • Os dados para cada item no conjunto de dados de séries temporais relacionadas devem ser iniciados no começo ou antes do começo de timestamp do item_id correspondente no conjunto de dados de séries temporais de destino.

    Por exemplo, se os dados de séries temporais de destino para socks começam em 2019-01-01 e os dados de séries temporais de destino para shoes começam em 2019-02-01, os dados de séries temporais relacionadas para socks devem começar em 2019-01-01 ou antes e os dados para shoes devem começar em 2019-02-01.

  • No conjunto de dados de séries temporais prospectivas relacionadas, o último carimbo de data e hora de cada item deve estar no último carimbo de data e hora na janela de previsão designada pelo usuário (chamada horizonte de previsão).

    No exemplo do arquivo de séries temporais relacionadas a seguir, os dados de timestamp das meias e dos sapatos devem terminar em 2019-07-01 ou depois (o último time stamp registrado) mais o horizonte de previsão. Se a frequência de dados na série temporal de destino for diária e o horizonte de previsão for de 10 dias, os pontos de dados diários deverão ser fornecidos no arquivo de séries temporais prospectivas relacionadas até 2019-07-11.

  • Nos conjuntos de dados de séries temporais históricas relacionadas, o último carimbo de data e hora de cada item deve corresponder ao último carimbo de data e hora na série temporal de destino.

    No exemplo do arquivo de séries temporais relacionadas a seguir, os dados timestamp de meias e sapatos devem terminar em 2019-07-01 (o último carimbo de data e hora registrado).

  • As dimensões do Forecast fornecidas no conjunto de dados de séries temporais relacionadas devem ser iguais ou um subconjunto das dimensões designadas no conjunto de dados de séries temporais de destino.

  • As séries temporais relacionadas não podem ter valores ausentes. Para obter informações sobre os valores ausentes em um conjunto de dados de séries temporais relacionadas, consulte Como lidar com valores ausentes.

A tabela a seguir mostra um arquivo de conjunto de dados de séries temporais relacionadas configurado corretamente. Para este exemplo, suponha o seguinte:

  • O último ponto de dados foi registrado no conjunto de dados de séries temporais de destino em 2019-07-01.

  • O horizonte de previsão é de 10 dias.

  • A granularidade de previsão é diária (D).

Uma linha "" indica todos os pontos de dados entre as linhas anteriores e posteriores.

timestamp item_id store price
2019-01-01 meias NYC 10
2019-01-02 meias NYC 10
2019-01-03 meias NYC 15
...
2019-06-01 meias NYC 10
...
2019-07-01 meias NYC 10
...
2019-07-11 meias NYC 20
2019-01-05 meias SFO 45
...
2019-06-05 meias SFO 10
...
2019-07-01 meias SFO 10
...
2019-07-11 meias SFO 30
2019-02-01 sapatos ORD 50
...
2019-07-01 sapatos ORD 75
...
2019-07-11 sapatos ORD 60

A tabela a seguir mostra as frequências de registro de dados compatíveis para séries temporais de destino e séries temporais relacionadas a serem previstas em uma granularidade semanal. Como os dados em um conjunto de dados de séries temporais relacionadas não podem ser agregados, o Forecast aceita apenas uma frequência de dados de séries temporais relacionadas que seja a mesma da granularidade de previsão escolhida.

Frequência de dados de entrada de destino Frequência de séries temporais Granularidade de previsão Compatível com o Forecast?
Por dia Por semana Por semana Sim
Por semana Por semana Por semana Sim
N/D Por semana Por semana Sim
Por dia Por dia Por semana Não
nota

Para atualizar um preditor existente para AutoPredictor, consulte Atualizando para AutoPredictor

Ao usar um preditor legado, você pode usar um conjunto de dados de série temporal relacionado ao treinar um preditor com os algoritmos CNN-QR, DeepAr+ e Prophet. NPTS, ARIMA, e ETSnão aceitam dados de séries temporais relacionados.

A tabela a seguir mostra os tipos de séries temporais relacionadas que cada algoritmo do Amazon Forecast aceita.

CNN-QR DeepAR+ Prophet NPTS ARIMA ETS

Séries temporais históricas relacionadas

Séries temporais prospectivas relacionadas

Ao usar o AutoML, você pode fornecer dados de séries temporais históricas e prospectivas relacionadas, e o Forecast só usará essas séries temporais quando aplicável.

Se você fornecer dados prospectivos relacionados à série temporal, a Forecast usará os dados relacionados com CNN -QR, DeepAr+ e Prophet, e não usará os dados relacionados com e. NPTS ARIMA ETS Se forem fornecidos dados históricos relacionados à série temporal, o Forecast usará os dados relacionados com CNN -QR e não usará os dados relacionados com DeepAr+, Prophet,,, e. NPTS ARIMA ETS