分類子調教データの作成 - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

分類子調教データの作成

カスタム分類では、マルチクラスモードまたはマルチラベルモードでモデルを調教します。マルチクラスモードでは、各文書に 1 つのクラスが関連付けられます。マルチラベルモードでは、1 つ以上のクラスが各文書に関連付けられます。入力ファイル形式はモードごとに異なるため、調教データを作成する前に使用するモードを選択してください。

注記

Amazon Comprehend コンソールでは、マルチクラスモードをシングルラベルモードと呼んでいます。

カスタム分類は、プレーンテキストのドキュメントでトレーニングするモデルと、ネイティブドキュメント (PDF、Word、イメージなど) でトレーニングするモデルをサポートします。分類子モデルとそれらがサポートする文書タイプの詳細については、「調教分類モデル」を参照してください。

カスタム分類子モデルの調教データを作成するには:

  1. この分類子に分析させたいクラスを特定します。使用するモード (マルチクラスまたはマルチラベル) を決定します。

  2. モデルがプレーンテキスト文書の分析用か、半構造化文書の分析用かに応じて、分類子モデルのタイプを決定します。

  3. 各クラスの文書例を集めます。最小調教要件については、「ドキュメント分類の一般的なクォータ」を参照してください。

  4. プレーンテキストモデルの場合は、使用するトレーニングファイル形式 (CSV ファイルまたは拡張マニフェストファイル) を選択します。ネイティブドキュメントモデルをトレーニングするには、常に CSV ファイルを使用します。