Treine classificadores personalizados (API) - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Treine classificadores personalizados (API)

Para criar e treinar um classificador personalizado, use a CreateDocumentClassifieroperação.

Você pode monitorar o progresso da solicitação usando a DescribeDocumentClassifieroperação. Após a transição do campo Status para TRAINED, você pode usar o classificador para classificar documentos. Se o status for TRAINED_WITH_WARNINGS, revise a pasta de arquivos ignorados no Saída do treinamento do classificador para a operação CreateDocumentClassifier.

Classificação personalizada de treinamento usando o AWS Command Line Interface

Os exemplos a seguir mostram como usar a operação CreateDocumentClassifier, a operação DescribeDocumentClassificationJob e outras APIs de classificadores personalizados com o AWS CLI.

O exemplo está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).

Crie um classificador personalizado de texto sem formatação usando a operação create-document-classifier.

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

Para criar um classificador personalizado nativo, forneça os seguintes parâmetros adicionais na solicitação para create-document-classifier.

  1. DocumentType: defina o valor como SEMI_STRUCTURED_DOCUMENT.

  2. Documents: a localização do S3 para os documentos de treinamento (e, opcionalmente, os documentos de teste).

  3. OutputDataConfig: forneça a localização do S3 para os documentos de saída (e uma chave KMS opcional).

  4. DocumentReaderConfig: campo opcional para configurações de extração de texto.

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ DocumentType \ Documents \ --output-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

Obtenha informações sobre um classificador personalizado com o classificador de documentos ARN usando a operação DescribeDocumentClassifier.

aws comprehend describe-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/file name

Exclua um classificador personalizado usando a operação DeleteDocumentClassifier.

aws comprehend delete-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/testDelete

Liste todos os classificadores personalizados na conta usando a operação ListDocumentClassifiers.

aws comprehend list-document-classifiers --region region

Usando o AWS SDK for Java ou SDK para Python

Para exemplos de SDK sobre como criar e treinar um classificador personalizado, consulte Use CreateDocumentClassifier com um AWS SDK ou CLI.