取代資料集 - Amazon Forecast

Amazon Forecast 不再提供給新客戶。Amazon Forecast 的現有客戶可以繼續正常使用該服務。了解更多」

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

取代資料集

取代資料集是基準線相關時間序列的修改版本,其中僅包含您要在假設預測中變更的值。取代資料集必須包含基準相關時間序列中的預測維度、項目識別碼和時間戳記,以及至少 1 個變更的時間序列。此資料集會與基準線相關的時間序列合併,以建立用於假設預測的轉換資料集。取代資料集必須為 CSV 格式必須為。

此資料集不應包含相同時間序列的重複時間戳記。

以下是您如何指定取代時間序列以及如何解譯這些規格的幾個範例。考慮一下您每天都在預測的情況下,預測水平線為 2022-08-01 通過 2022-08-03。下表列出了所有範例的基準線相關時間序列。

item_id timestamp 價格 股票計數

項目 _1

2022-08-01

100

50

項目 _1

2022-08-02

100

50

項目 _1

2022-08-03

100

50

項目 _2

2022-08-01

75

500

項目 _2

2022-08-02

75

500

項目 _2

2022-08-03

75

500

Unchanged values

要在 2022-08-02 和 2022-08-03 的項目 1 上使用 10% 的 discount,就足以為替換數據集指定以下內容:

取代資料集
item_id timestamp 價格

項目 _1

2022-08-02

90

項目 _1

2022-08-03

90

不過,在取代資料集中指定未變更的值也是有效的。當作取代資料集使用時,下列三個資料表中的每個資料表都會產生與先前提供之資料表相同的結果。

以未變更的資料欄取代資料集
item_id timestamp 價格 股票計數

項目 _1

2022-08-02

90

50

項目 _1

2022-08-03

90

50

以未變更的列取代資料集
item_id timestamp 價格

項目 _1

2022-08-01

100

項目 _1

2022-08-02

90

項目 _1

2022-08-03

90

項目 _2

2022-08-01

75

項目 _2

2022-08-02

75

項目 _2

2022-08-03

75

以未變更的列和欄取代資料集
item_id timestamp 價格 股票計數

項目 _1

2022-08-01

100

50

項目 _1

2022-08-02

90

50

項目 _1

2022-08-03

90

50

項目 _2

2022-08-01

75

500

項目 _2

2022-08-02

75

500

項目 _2

2022-08-03

75

500

Missing values

取代時間序列中缺少的值會被基準線相關時間序列中的值取代。考慮一下您對商品 1 的 10% discount 優惠,並在 2022 年 8 月 3 日增加商品的庫存量的情況。此取代資料集就足夠了:

以遺漏值取代資料集
item_id timestamp 價格 股票計數

項目 _1

2022-08-02

90

項目 _1

2022-08-03

90

項目 _2

2022-08-01

5000

此表格遺漏的值是從基準線相關的時間序列導入的。

Extraneous values

建立假設預測時,會忽略取代時間序列中的多餘值。也就是說,取代資料集中與基準線相關時間序列中的值不對應的值不會建立模型。考慮這個替代數據集:

用多餘的值替換數據集
item_id timestamp 價格 股票計數

項目 _1

2022-08-01

100

50

項目 _1

2022-08-02

100

50

項目 _1

2022-08-03

100

50

項目 _2

2022-08-01

75

500

項目 _2

2022-08-02

75

500

項目 _2

2022-08-03

75

500

項目 _3

2022-08-01

50

125

項目 _3

2022-08-02

50

125

項目 _3

2022-08-03

50

125

包含 item_3 的列會被忽略,而且不是假設分析的一部分。

Historical changes

在預測總時程之外的取代資料集中的變更會被忽略。考慮這個替代數據集:

以預測總時程以外的值取代資料集
item_id timestamp 價格 股票計數

項目 _1

2022-07-31 發

100

50

項目 _1

2022-08-01

100

50

項目 _1

2022-08-02

100

50

項目 _1

2022-08-03

100

50

項目 _1

2022-08-04

100

50

項目 _2

2022-07-31 發

75

500

項目 _2

2022-08-01

75

500

項目 _2

2022-08-02

75

500

項目 _2

2022-08-03

75

500

項目 _3

2022-08-04

75

500

包含 2022-07-31 和 2022-08-04 的行將被忽略,並且不屬於假設分析的一部分。

Forecast 維度

如果您在資料集中包含預測維度,則必須將它們包含在取代資料集中。請考慮此基準線相關的時間序列:

item_id 商店識別碼 timestamp 價格 股票計數

項目 _1

商店 _1

2022-08-01

100

50

項目 _1

商店 _1

2022-08-02

100

50

項目 _1

商店 _1

2022-08-03

100

50

項目 _1

商店 _2

2022-08-01

75

500

項目 _1

商店 _2

2022-08-02

75

500

項目 _1

商店 _2

2022-08-03

75

500

因此,2022-08-02 上所有商店的 10% discount 的替換數據集將如下所示:

item_id 商店識別碼 timestamp 價格

項目 _1

商店 _1

2022-08-02

90

項目 _1

商店 _2

2022-08-02

67.5