Formulazione del problema - Amazon Machine Learning

Non aggiorniamo più il servizio Amazon Machine Learning né accettiamo nuovi utenti. Questa documentazione è disponibile per gli utenti esistenti, ma non la aggiorneremo più. Per ulteriori informazioni, consulta la paginaCos'è Amazon Machine Learning.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Formulazione del problema

Il primo passo nel machine learning è quello di decidere ciò che si desidera prevedere, ovvero l'etichetta o la risposta target. Si può immaginare uno scenario in cui si desidera fabbricare prodotti, ma la decisione di fabbricare ogni prodotto dipende dal numero di vendite potenziali. In questo scenario, si vuole prevedere quante volte ogni prodotto sarà acquistato (previsione del numero di vendite). Esistono diversi modi per definire questo problema utilizzando il machine learning. La scelta di come definire il problema varia a seconda del caso d'uso o delle esigenze aziendali.

Si desidera prevedere il numero di acquisti che i clienti effettueranno per ogni prodotto (nel qual caso il target è numerico e si sta risolvendo un problema di regressione)? Oppure si vuole prevedere quali prodotti avranno più di 10 acquisti (nel qual caso il target è binario e si sta risolvere un problema di classificazione binaria)?

È importante evitare di complicare eccessivamente il problema e trovare la soluzione più semplice adatta alle esigenze. Tuttavia, è anche importante evitare di perdere informazioni, soprattutto le informazioni nella cronologia risposte. In questo caso, la conversione del numero di vendite precedenti effettive in una variabile binaria "oltre 10" invece di "meno" farebbe perdere informazioni preziose. Se si investe tempo nel decidere quale target abbia più senso prevedere, si eviterà la creazione di modelli che non rispondono alla domanda.