訓練自訂分類器 (API) - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

訓練自訂分類器 (API)

若要建立和訓練自訂分類器,請使用此CreateDocumentClassifier作業。

您可以使用DescribeDocumentClassifier操作監視請求的進度。Status欄位轉換為之後TRAINED,您可以使用分類器來分類文件。如果狀態為TRAINED_WITH_WARNINGS,請分類器訓練輸出CreateDocumentClassifier作業中檢閱略過的檔案資料夾。

使用訓練自訂分類 AWS Command Line Interface

下列範例說明如何搭配使用CreateDocumentClassifierDescribeDocumentClassificationJob業、作業和其他自訂分類器 AWS CLI API。

這些範例已針對 Unix、Linux 和 macOS 進行格式化。用於 Windows 時,請以插入號 (^) 取代每一行結尾處的 Unix 接續字元斜線 (\)。

使用操作創建純文本自定義分類器。create-document-classifier

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

若要建立原生自訂分類器,請在create-document-classifier要求中提供下列其他參數。

  1. DocumentType:將值設定為「半結構 _ 文件」。

  2. 文件:訓練文件的 S3 位置 (以及可選的測試文件)。

  3. OutputDataConfig:提供輸出文件的 S3 位置 (以及選用的 KMS 金鑰)。

  4. DocumentReaderConfig: 文字擷取設定的選用欄位。

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ DocumentType \ Documents \ --output-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

使用該操作使用文檔分類器 ARN 獲取有關自定義分類器的信息。DescribeDocumentClassifier

aws comprehend describe-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/file name

使用操作刪除自訂分類DeleteDocumentClassifier器。

aws comprehend delete-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/testDelete

使用ListDocumentClassifiers操作列出帳戶中的所有自訂分類器。

aws comprehend list-document-classifiers --region region

使用 AWS SDK for Java 或開發套件

如需如何建立和訓練自訂分類器的 SDK 範例,請參閱使用開發套件建立 Amazon Comprehend 文件分類器 AWS