使用相關時間序列資料集 - Amazon Forecast

Amazon Forecast 不再提供給新客戶。Amazon Forecast 的現有客戶可以繼續正常使用該服務。了解更多」

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用相關時間序列資料集

相關時間序列資料集包含目標時間序列資料集未包含的時間序列資料,可能會改善預測器的準確性。

例如,在需求預測網域中,目標時間序列資料集將包含timestampitem_id維度,而互補的相關時間序列資料集也包含下列補充功能:item pricepromotion、和weather

一個相關時間序列資料集最多可包含 10 個預測維度 (與目標時間序列資料集相同),以及最多 13 個相關的時間序列功能。

Python 筆記本

如需使用相關時間序列資料集的 step-by-step 指南,請參閱合併相關時間序列

注意

包含預測總時程內任何值的相關時間序列會被視為前瞻性時間序列。

相關的時間序列有兩種形式:

  • 歷史時間序列:預測總時程內沒有資料點的時間序列。

  • 前瞻性時間序列:資料點在預測總時程內的時間序列。

歷史相關時間序列包含到預測總時程為止的資料點,且不包含預測總時程內的任何資料點。前瞻性相關時間序列包含直至預測總時程內資料點。

Time series graph showing target, forward-looking, and historical related data with forecast window.

相關時間序列資料集有下列限制:

  • 它不能包含來自目標時間序列的目標值。

  • 它必須包括 item_idtimestamp 維度,以及至少一個相關特徵 (例如 price)。

  • 相關時間序列功能資料必須是 intfloat 資料類型。

  • 若要使用整個目標時間序列,目標時間序列資料集中的所有項目也必須包含在相關的時間序列資料集中。如果相關時間序列僅包含目標時間序列中的料號子集,則模型建立與預測產生將限制為該特定料號子集。

    例如,如果目標時間序列包含 1000 個料號,而相關的時間序列資料集僅包含 100 個料號,則模型與預測將僅以這 100 個料號為基礎。

  • 在相關時間序列資料集中記錄資料的頻率,必須符合您要產生預測的間隔 (預測精細程度)。

    例如,如果您想要以每週精細程度產生預測,則在相關時間序列中記錄資料的頻率也必須是每週,即使在目標時間序列中記錄資料的頻率是每日也一樣。

  • 相關時間序列資料集中每個項目的資料都必須早於或從目標時間序列資料集中對應 item_id 的開頭 timestamp 開始。

    例如,如果 socks 的目標時間序列資料從 2019-01-01 開始,而 shoes 的目標時間序列資料從 2019-02-01 開始,則 socks 的相關時間序列資料必須早於或在 2019-01-01 開始,而 shoes 的資料必須早於或在 2019-02-01 開始。

  • 對於前瞻性相關的時間序列資料集,每個項目的最後時間戳記必須位於使用者指定的預測視窗 (稱為預測總時程) 的最後時間戳記上。

    在以下的範例相關時間序列檔案中,襪子和鞋子的 timestamp 資料必須結束於 2019-07-01 或其後 (最後記錄的時間戳記)「加上」預測期間。如果目標時間序列中的資料頻率是每日且預測時程為 10 天,則必須在前瞻性的相關時間序列檔案中提供每日資料點,直到 2019-07-11。

  • 對於歷史相關的時間序列資料集,每個項目的最後時間戳記都必須與目標時間序列中的最後一個時間戳記相符。

    在下面的範例相關時間序列檔案中,襪子和鞋子的timestamp資料必須在 2019-07-01 (最後記錄的時間戳記) 結束。

  • 相關時間序列資料集中提供的「Forecast」維度必須等於或是目標時間序列資料集中指定的維度子集。

  • 相關時間序列不能缺少值。如需相關時間序列資料集中缺少值的詳細資訊,請參閱處理遺失的值

下表顯示正確設定的相關時間序列資料集檔案。在本範例中,假設下列情況:

  • 目標時間序列資料集記錄的最後一個資料點為 2019-07-01。

  • 預測期間為 10 天。

  • 預測精細程度為每日 (D)。

"" 資料列表示上一列與後續列之間的所有資料點。

timestamp item_id store price
2019-01-01 襪子 NYC 10
2019-01-02 襪子 NYC 10
2019-01-03 襪子 NYC 15
...
2019-06-01 襪子 NYC 10
...
2019-07-01 襪子 NYC 10
...
2019-07-11 襪子 NYC 20
2019-01-05 襪子 SFO 45
...
2019-06-05 襪子 SFO 10
...
2019-07-01 襪子 SFO 10
...
2019-07-11 襪子 SFO 30
2019-02-01 鞋子 ORD 50
...
2019-07-01 鞋子 ORD 75
...
2019-07-11 鞋子 ORD 60

下表顯示目標時間序列的相容資料記錄頻率,以及以每週精細度預測的相關時間序列。由於無法彙總相關時間序列資料集中的資料,因此「Forecast」僅接受與所選預測粒度相同的相關時間序列資料頻率。

目標輸入資料頻率 相關時間序列頻率 預測精細程度 由 Forecast 支持?
每日 每週 每週
每週 每週 每週
N/A 每週 每週
每日 每日 每週
注意

若要將現有預測值升級至 AutoPredictor,請參閱 升級到 AutoPredictor

使用舊式預測值時,您可以在使用 CNN-QR、DeepAR + 和 Propher 演算法訓練預測值時,使用相關的時間序列資料集。NPTSARIMA,且ETS不接受相關的時間序列資料。

下表顯示每個 Amazon Forecast 演算法接受的相關時間序列類型。

CNN-二維碼 DeepAR+ Prophet NPTS ARIMA ETS

歷史相關時間序列

前瞻性的相關時間序列

使用 AutoML 時,您可以同時提供歷史和前瞻性相關的時間序列資料,而且「Forecast」只會在適用的情況下使用這些時間序列。

如果您提供前瞻性的相關時間序列資料,Forecast 會將相關資料與 CNN-QR、DeepAR + 和 Propher 一起使用,且不會將相關資料與、和一起使用。NPTS ARIMA ETS如果提供歷史相關的時間序列資料,Forecast 會將相關資料與 CNN-QR 搭配使用,且不會將相關資料用於 DeepAR +、Propher、NPTS、ARIMA和。ETS