關於預測
在本文件中,預測是指預測時間序列的未來值:問題的輸入或輸出具有時間序列的屬性。
預測系統
預測系統包含各式各樣的使用者:
-
最終使用者,會查詢特定產品的預測,並決定要購買多少單位;有可能是個人或自動化系統。
-
業務分析師/商業智慧,負責支援最終使用者,執行和組織彙總報告。
-
資料科學家,會反覆分析需求模式、因果關係,並添加新特徵,以逐漸改良模型或改進預測模型。
-
工程師,負責設定資料收集的基礎架構,並確保系統的輸入資料可供使用。
Amazon Forecast 可減輕軟體工程師的工作負擔,並且讓資料科學能力有限的企業得以運用最先進的預測技術。對於具有資料科學能力的企業,Amazon Forecast 包含許多診斷功能,因此能夠妥善解決預測問題。
預測問題發生於何處?
在許多會自然產生時間序列資料的領域中,都會發生預測問題。其中包括零售銷售、醫學分析、容量規劃、感應器網路監控、財務分析、社交活動探勘和資料庫系統。例如,在具備資料驅動決策能力的多數企業中,預測在自動化和最佳化營運程序方面扮演著重要角色。產品供需的預測可用於最佳庫存管理、員工排班和拓撲規劃,且一般來說,對絕大多數的供應鏈最佳化環節而言都是關鍵技術。
下圖包含預測問題的摘要,以顯現模式的觀測時間序列為基礎 (在此範例中為季節性),對指定的期間建立預測。水平軸代表從過去 (左) 到未來 (右) 的時間。垂直軸代表測量單位。基於過去 (藍色線段) 到垂直黑線識別未來 (紅色線段),是預測任務。

預測任務概觀
嘗試解決預測問題前的考量事項
在解決預測問題之前最需要了解的重要問題是:
-
您需要解決預測問題嗎?
-
你為何要解決預測問題?
由於時間序列資料無所不在,我們隨處都可輕易發現預測問題。然而,關鍵問題在於是否真的需要解決預測問題,或者,您是否大可規避這類問題且不犧牲有效的業務決策。提出此問題是很重要的,因為就科學上而言,預測是機器學習中最困難的問題之一。
以線上零售商的產品推薦為例。我們可將這類產品推薦問題設想為預測問題,其中,對於每個客戶/存貨單位 (SKU) 配對,您要預測該名客戶將購買之特定品項的單位數量。此問題表述有許多好處。其中一項好處是明確將時間要素納入考量,因此您可以根據客戶的購買模式推薦產品。
但是,產品推薦問題很少被制定為預測問題,因為解決此類預測問題要比直接解決建議問題困難得多 (例如,因為客戶 SKU 層級的資訊稀少,問題的規模較大)。因此,在思考預測應用程式時,請務必考慮預測的下游使用,以及是否可使用替代方法來解決此問題。
在這些情況下,Amazon Personalize
確認您需要解決預測問題後,下一個浮現的問題是,為何要解決預測問題? 在許多企業的設想下,預測通常只是為了達到目的的手段。以零售業的需求預測為例,預測可用來進行庫存管理決策。預測問題通常會輸入到決策問題中,繼而成為最佳化問題模型的一部分。
舉例來說,這種決策問題包括要購買的單位數量或處理現有庫存的最佳方法。其他商業預測問題包括預測伺服器容量或預測製造業的原料/零件需求。這些預測可作為其他程序的輸入 (無論是用於上述決策問題,還是用於案例模擬),繼而用於沒有明確模型的規劃。所謂的預測本身並非目的,是有例外情況的。例如,在財務預測中,預測會直接用來建立財務儲備或提交給投資者。
若要了解預測的目的,請考量下列問題:
-
您應預測多久之後的未來?
-
您多久要產生一次預測?
-
您是否應深入研究預測的某些具體層面?