Executando trabalhos de análise para reconhecimento personalizado de entidades - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Executando trabalhos de análise para reconhecimento personalizado de entidades

Você pode executar um trabalho de análise assíncrona para detectar entidades personalizadas em um conjunto de um ou mais documentos.

Antes de começar

Você precisa de um modelo de reconhecimento de entidade personalizado (também conhecido como reconhecedor) antes de poder detectar entidades personalizadas. Para mais informações sobre esses modelos, consulte Treinamento de modelos reconhecedores de entidades personalizados.

Um reconhecedor treinado com anotações em texto sem formatação é compatível com a detecção de entidades somente para documentos em texto sem formatação. Um reconhecedor treinado com anotações de documentos PDF é compatível com a detecção de entidades para documentos de texto sem formatação, imagens, arquivos PDF e documentos do Word. Para arquivos que não sejam arquivos de texto, o Amazon Comprehend executa a extração de texto antes de executar a análise. Para informações sobre os arquivos de entrada, consulte Entradas para análise personalizada assíncrona.

Se você planeja analisar arquivos de imagem ou documentos PDF digitalizados, sua política do IAM deve conceder permissões para usar dois métodos da API Amazon Textract DetectDocumentText ( AnalyzeDocumente). O Amazon Comprehend invoca esses métodos durante a extração de texto. Para visualizar um exemplo de política, consulte Permissões necessárias para executar ações de análise de documentos.

Para executar um trabalho de análise assíncrona, execute as seguintes etapas gerais:

  1. Armazene os documentos em um bucket do Amazon S3.

  2. Use a API ou o console para iniciar o trabalho de análise.

  3. Monitore o progresso do trabalho de análise.

  4. Depois que o trabalho for concluído, recupere os resultados da análise do bucket do S3 que você especificou ao iniciar o trabalho.