本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
FAQs 關於使用機器學習來預測新產品需求
以下是與實作 ML 模型相關的常見問題,可預測新產品推出的需求。
我應該動員誰來啟動程序?
組織的整備度會直接受到您從上層管理獲得多少支援的影響。我們建議您取得資料科學或分析部門、供應鏈、行銷和 IT 經理的核准。請求其他利益相關者和領導者為您的組織提供適當的支援。
我應該組合哪種團隊?
為了成功交付倡議並產生可衡量的結果,請組成一個團隊,其中包含:
-
用於模型開發的資料科學家
-
資料收集和擷取的資料工程師
-
適用於模型部署和自助式儀表板的機器學習工程師
-
領域專業知識的主題專家
我需要哪些歷史資料以及多少?
請考慮取得下列資料:
-
從產品啟動到終止的所有類似產品的銷售資料。
-
描述產品功能和屬性的中繼資料。CE 產品的這些屬性範例可能是藍牙功能、無線功能、USB類型和顏色。
-
與銷售資料相關的時間序列資料,例如行銷資料、假日資料、檢閱資料和評分資料。
注意
如果您可以將相關的時間序列資料擴展到模型推論的預測時間範圍,這很有幫助。例如,如果相關的時間序列資料是假日,您可以將假日的時間序列資料擴展到未來,因為您事先知道假日。
我應該在何時開始產生新產品的需求預測?
這是每個組織需要做出的商業決策。在理想情況下,組織應使用預測來滿足新產品的需求。建議您在開始製造新產品之前,先產生每週或每月NPI需求預測。預測可協助您正確估算零件和人力。
我應該收集哪些第三方資料?
您可以考慮新增下列第三方資料,以取得更準確的預測:消費者索引、生活成本代理,以及競爭對手的銷售歷史記錄。此第三方資料會被視為相關的時間序列資料。請考慮在與銷售資料相同的期間內以相同的週期取得此資料 (例如每日或每週)。
我需要的最低基礎設施為何?
基礎設施至少應支援下列項目:
-
資料擷取管道,其中以批次或透過串流模式收集資料
-
預先處理ETL管道,可擷取原始資料並將其轉換為適用於 ML 建模的標準化輸入格式
-
模型開發、實驗和驗證的開發環境
-
持續整合和持續部署 (CI/CD) 管道,將 ML 模型推送至生產環境
-
模型登錄、監控和重新訓練的機制
如何驗證我的資料驅動方法是否有效? KPIs 是什麼?
每個資料科學倡議或資料驅動解決方案都需要根據一組關鍵效能指標進行驗證 (KPIs)。這些指標KPIs可以衡量模型的預測與實際需求有多接近。您可以針對不同的期間產生此指標,例如未來 1 週或 1 個月的預測。您也可以根據模型產生的預測,直接測量過度排序或低排序的組件數量。利益相關者和上級管理層應該仔細制定一組KPIs可追蹤模型效能的 。使用這些KPIs項目來判斷 ROI 是否符合預期。
我應該多久產生預測一次?
預測頻率取決於兩個因素。您希望預測與可用時間序列資料集的緊密連線程度為何? 來自相關時間序列資料集的資料變數為何? 一般而言,經常產生預測可協助您的組織做好適當準備,以滿足新產品的需求。
如何啟用自助式服務?
隨著容量的增加,組織應該開發自助式基礎設施,以自動化資料擷取、預先處理和模型訓練管道,以產生預測。應測量 ML 模型結果和影響,並將其發佈至儀表板以進行隨需存取。
AWS 定價如何運作?
如需詳細資訊,請參閱 AWS
定價