Entraînez des classificateurs personnalisés (API) - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Entraînez des classificateurs personnalisés (API)

Pour créer et entraîner un classificateur personnalisé, utilisez l'CreateDocumentClassifieropération.

Vous pouvez suivre la progression de la demande à l'aide de l'DescribeDocumentClassifieropération. Une fois le Status champ passé àTRAINED, vous pouvez utiliser le classificateur pour classer les documents. Si le statut est le casTRAINED_WITH_WARNINGS, passez en revue le dossier des fichiers ignorés dans le formulaire Résultat d'entraînement du classificateur de l'CreateDocumentClassifieropération.

Classification personnalisée de la formation à l'aide du AWS Command Line Interface

Les exemples suivants montrent comment utiliser l'CreateDocumentClassifieropération, l'DescribeDocumentClassificationJobopération et d'autres API de classification personnalisées avec le AWS CLI.

Les exemples sont formatés pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\), à la fin de chaque ligne par un accent circonflexe (^).

Créez un classificateur personnalisé en texte brut à l'aide de l'opération. create-document-classifier

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

Pour créer un classificateur personnalisé natif, fournissez les paramètres supplémentaires suivants dans la create-document-classifier demande.

  1. DocumentType: définissez la valeur sur SEMI_STRUCTURED_DOCUMENT.

  2. Documents : emplacement S3 pour les documents de formation (et, éventuellement, les documents de test).

  3. OutputDataConfig: indiquez l'emplacement S3 des documents de sortie (et une clé KMS optionnelle).

  4. DocumentReaderConfig: champ facultatif pour les paramètres d'extraction de texte.

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ DocumentType \ Documents \ --output-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

Obtenez des informations sur un classificateur personnalisé avec l'ARN du classificateur de documents à l'aide de l'DescribeDocumentClassifieropération.

aws comprehend describe-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/file name

Supprimez un classificateur personnalisé à l'aide de cette DeleteDocumentClassifier opération.

aws comprehend delete-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/testDelete

Répertoriez tous les classificateurs personnalisés du compte à l'aide de l'ListDocumentClassifiersopération.

aws comprehend list-document-classifiers --region region

Utilisation du SDK AWS SDK for Java or pour Python

Pour des exemples de SDK expliquant comment créer et entraîner un classificateur personnalisé, consultez. Utilisation CreateDocumentClassifier avec un AWS SDK ou une CLI