翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
分類子調教データの作成
カスタム分類では、マルチクラスモードまたはマルチラベルモードでモデルを調教します。マルチクラスモードでは、各文書に 1 つのクラスが関連付けられます。マルチラベルモードでは、1 つ以上のクラスが各文書に関連付けられます。入力ファイル形式はモードごとに異なるため、調教データを作成する前に使用するモードを選択してください。
注記
Amazon Comprehend コンソールでは、マルチクラスモードをシングルラベルモードと呼んでいます。
カスタム分類は、プレーンテキストのドキュメントでトレーニングするモデルと、ネイティブドキュメント (PDF、Word、イメージなど) でトレーニングするモデルをサポートします。分類子モデルとそれらがサポートする文書タイプの詳細については、「調教分類モデル」を参照してください。
カスタム分類子モデルの調教データを作成するには:
-
この分類子に分析させたいクラスを特定します。使用するモード (マルチクラスまたはマルチラベル) を決定します。
-
モデルがプレーンテキスト文書の分析用か、半構造化文書の分析用かに応じて、分類子モデルのタイプを決定します。
-
各クラスの文書例を集めます。最小調教要件については、「ドキュメント分類の一般的なクォータ」を参照してください。
-
プレーンテキストモデルの場合は、使用するトレーニングファイル形式 (CSV ファイルまたは拡張マニフェストファイル) を選択します。ネイティブドキュメントモデルをトレーニングするには、常に CSV ファイルを使用します。