複数クラスの分類 - Amazon Machine Learning

Amazon Machine Learning サービスの更新や、その新しいユーザーの受け入れは行っていません。このドキュメントは既存のユーザー向けに提供されていますが、更新は終了しています。詳細については、「Amazon Machine Learning とは」を参照してください。

複数クラスの分類

バイナリ分類問題のプロセスとは異なり、予測を行うのにスコアしきい値を選択する必要はありません。予測される回答は、予測スコアが最も高いクラス (つまり、ラベル) です。時には、スコアが高いと予測される場合にのみ予測回答を使用することもできます。この場合は、予測された回答を受け入れるかどうかを決定するための予測スコアのしきい値を選択することができます。

複数クラスで使用される一般的なメトリクスは、バイナリ分類のケースで使用されるメトリクスと同じです。他のすべてのクラスを第 2 クラスに属するとしてグループ化した後、メトリクスをバイナリ分類問題として扱うことによって、メトリクスはクラスごとに計算されます。次に、マクロ平均 (各クラスを同様に扱う)、または、加重平均 (クラスの頻度により重みづけされる) のいずれかを得るために、バイナリメトリクスはすべてのクラスで平均されます。Amazon ML では、マクロ平均 F1 測定値を使用して、複数クラス分類子の予測の成功を評価します。

図 2: 複数クラス分類モデルの混同行列

複数クラス問題で混合行列を確認することは有用です。混同行列とは、評価データの各クラスと、正しい予測と誤った予測の数または割合を示す表です。