使用項目中繼資料集 - Amazon Forecast

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用項目中繼資料集

項目中繼資料資料集包含分類資料,可為目標時間序列資料集中的項目提供有價值的內容。與相關的時間序列資料集不同,項目中繼資料集提供的是靜態資訊。也就是說,資料值隨著時間的推移保持不變,例如項目的顏色或品牌。項目中繼資料資料集是資料集群組的選用新增項目。只有當目標時間序列資料集中的每個項目都存在於對應的項目中繼資料集中,您才可以使用項目中繼資料。

項目中繼資料可能包括特定項目的品牌、顏色、型號、類別、原產地或其他補充功能。例如,項目中繼資料集可能會提供一些在目標時間序列數據集中找到的需求資料內容,代表 32 GB 儲存體黑色 Amazon 電子閱讀器的銷售。因為這些特性不會從 day-to-day 或變更 hour-to-hour,所以它們屬於項目中繼資料資料集中。

項目中繼資料對於探索和追蹤您的時間序列資料的描述性模式非常有用。如果您在資料集群組中包含項目中繼資料資料集,則 Forecast 可訓練模型,以根據項目之間的相似性進行更準確的預測。例如,您可能會發現由 Amazon 製造的虛擬助理產品,比起由其他公司製造的產品,更有可能銷售一空,然後相應地規劃您的供應鏈。

項目中繼資料在 coldstart 預測案例中特別有用,在這種情況下,您沒有可用來進行預測的歷史資料,但在具有類似中繼資料屬性的項目上具有歷史資料。項目中繼資料可讓「Forecast」利用與您的冷啟動項目相似的項目來產生預測。

當您包含料號中繼資料時,「Forecast」會根據類似的時間序列建立冷啟動預測,以建立更準確的預測。系統會針對項目中繼資料資料集中但不在後置時間序列中的項目產生 Coldstart 預測。首先,「Forecast」會針對非冷期開始料號產生預測,這些料號是在後置時間序列中具有歷史資料的料號。接下來,針對每個 coldstart 項目,會使用項目中繼資料資料集找到最近的鄰近項目。然後,這些最接近的鄰居用於建立冷啟動預測。

項目中繼資料集中的每一列最多可包含 10 個中繼資料欄位,其中一個必須是識別欄位,以比對中繼資料與目標時間序列中的項目。與所有資料集類型一樣,每個欄位的值是由資料集結構描述指定。

Python 筆記本

如需使用項目中繼資料的 step-by-step 指南,請參閱合併項目中繼資料

範例:項目中繼資料檔案和結構描述

下表顯示描述 Amazon 電子閱讀器正確設定項目中繼資料集檔案的區段。在此範例中,假設標頭列代表資料集的結構描述,而且每個列出的項目都位於對應的目標時間序列資料集中。

item_id brand model color waterproof
1 amazon paperwhite black
2 amazon paperwhite blue
3 amazon base_model black 編號
4 amazon base_model white 編號
...

以下是以 CSV 格式表示的相同資訊。

1,amazon,paperwhite,black,yes 2,amazon,paperwhite,blue,yes 3,amazon,base_model,black,no 4,amazon,base_model,white,no ...

以下是此範例資料集的結構描述。

{ "attributes": [ { "AttributeName": "item_id", "AttributeType": "string" }, { "AttributeName": "brand", "AttributeType": "string" }, { "AttributeName": "model", "AttributeType": "string" }, { "AttributeName": "color", "AttributeType": "string" }, { "AttributeName": "waterproof", "AttributeType": "string" } ] }

舊版預測值和項目中繼資料

注意

若要將現有預測值升級至 AutoPredictor,請參閱 升級到 AutoPredictor

使用舊式預測值時,您可以在使用 CNN-QR 或 DeepAR + 演算法訓練預測值時使用項目中繼資料。使用 AutoML 時,您可以提供項目中繼資料,而 Forecast 只會在適用的情況下使用這些時間序列

另請參閱

如需使用項目中繼資料資料集的深入逐步解說,請參閱將項目中繼資料資料集合併至 Amazon 預測範例 GitHub 儲存庫中的預測值。