明確地描述問題 (建立問題的格式) - Amazon Machine Learning

我們不再更新 Amazon Machine Learning 服務或接受新使用者。本文件適用於現有使用者,但我們不再對其進行更新。如需詳細資訊,請參閱什麼是 Amazon Machine Learning

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

明確地描述問題 (建立問題的格式)

機器學習的第一步,是決定您要預測什麼,這稱為標籤或目標答案。假設您想要製造產品,但您對於製造每個產品的決策,取決於其潛在銷售數量。在此案例中,您想要預測每個產品的購買次數 (預測銷售數量)。使用機器學習來定義此問題的方法有很多種。選擇如何定義問題,取決於您的使用案例或業務需求。

您想要預測客戶對於每個產品的購買數量 (在這種情況下,目標是數值而您需解決回歸問題)? 還是想預測哪些產品會被購買超過 10 次 (在這種情況下,目標是二元而您需解決二元分類問題)?

請勿把問題過度複雜化,應建構可滿足您需求的最簡單解決方案。不過,也請避免遺漏資訊,尤其是歷史答案中的資訊。在這種情況下,將實際的過去銷售數量轉換成二元變數「超過 10」相較於「較少」會遺失寶貴的資訊。花點時間來決定哪個目標對您來說是最有意義的預測,可讓您省下時間以免建置無法回答您問題的模型。