Entrene clasificadores personalizados () API - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Entrene clasificadores personalizados () API

Para crear y entrenar un clasificador personalizado, utilice la CreateDocumentClassifieroperación.

Puede supervisar el progreso de la solicitud mediante la DescribeDocumentClassifieroperación. Una vez que el campo Status pase a TRAINED, puede utilizar el clasificador para clasificar los documentos. Si el estado es TRAINED_WITH_WARNINGS, revise la carpeta de archivos omitidos en Resultado del entrenamiento del clasificador en la operación CreateDocumentClassifier.

Entrenamiento de clasificación personalizada mediante el AWS Command Line Interface

Los siguientes ejemplos muestran cómo utilizar la CreateDocumentClassifier operación, la DescribeDocumentClassificationJob operación y otros clasificadores personalizados APIs con el AWS CLI.

Los ejemplos están preparados para Unix, Linux y macOS. Para Windows, sustituya la barra diagonal invertida (\) utilizada como carácter de continuación de Unix al final de cada línea por el signo de intercalación (^).

Cree un clasificador personalizado de texto sin formato con la operación create-document-classifier.

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

Para crear un clasificador personalizado nativo, proporcione los siguientes parámetros adicionales en la solicitud create-document-classifier.

  1. DocumentType: establezca el valor en SEMI _ STRUCTURED _DOCUMENT.

  2. Documentos: la ubicación S3 de los documentos de entrenamiento (y, opcionalmente, de los documentos de prueba).

  3. OutputDataConfig: proporcione la ubicación S3 para los documentos de salida (y una KMS clave opcional).

  4. DocumentReaderConfig: campo opcional para la configuración de extracción de texto.

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ DocumentType \ Documents \ --output-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

Obtenga información sobre un clasificador personalizado con el clasificador de documentos ARN mediante la DescribeDocumentClassifier operación.

aws comprehend describe-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/file name

Elimine un clasificador personalizado mediante la operación DeleteDocumentClassifier.

aws comprehend delete-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/testDelete

Enumere todos los clasificadores personalizados de la cuenta mediante la operación ListDocumentClassifiers.

aws comprehend list-document-classifiers --region region

Uso de AWS SDK for Java o SDK para Python

Para ver SDK ejemplos de cómo crear y entrenar un clasificador personalizado, consulteÚselo CreateDocumentClassifier con un AWS SDK o CLI.