Classificazione multiclasse - Amazon Machine Learning

Non aggiorniamo più il servizio Amazon Machine Learning né accettiamo nuovi utenti. Questa documentazione è disponibile per gli utenti esistenti, ma non la aggiorniamo più. Per ulteriori informazioni, consulta Cos'è Amazon Machine Learning.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Classificazione multiclasse

A differenza del processo per i problemi di classificazione binaria, non è necessario scegliere un punteggio soglia per fare previsioni. La risposta prevista è la classe (ad esempio, l'etichetta) con il miglior punteggio previsto. In alcuni casi, può essere opportuno utilizzare la risposta prevista solo se il suo punteggio è elevato. In questo caso, è possibile scegliere una soglia per i punteggi previsti in base alla quale si accetta o meno la risposta prevista.

I parametri tipici utilizzati nella multiclasse sono gli stessi utilizzati nel caso della classificazione binaria. Il parametro viene calcolato per ogni classe trattandolo come un problema di classificazione binaria, dopo avere raggruppato tutte le altre classi come appartenenti alla seconda classe. Quindi il parametro binario viene calcolato come media di tutte le classi, per ottenere un parametro di macro media (ogni classe è trattata allo stesso modo) o di media ponderata (ponderazione in base alla frequenza della classe). In Amazon ML, la misura F1 della media macro viene utilizzata per valutare il successo predittivo di un classificatore multiclasse.

Confusion matrix showing predicted vs. true values for Romance, Thriller, and Adventure genres with F1 scores.

Figura 2: matrice di confusione per un modello di classificazione multiclasse

È utile esaminare la matrice di confusione per i problemi multiclasse. La matrice di confusione è una tabella che mostra ogni classe dei dati di valutazione e il numero o la percentuale di previsioni esatte e di previsioni errate.