Análise em tempo real para classificação personalizada (API) - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Análise em tempo real para classificação personalizada (API)

Você pode usar a API do Amazon Comprehend para executar a classificação em tempo real com um modelo personalizado. Primeiro, crie um endpoint para executar a análise em tempo real. Depois de criá-lo, execute a classificação em tempo real.

Os exemplos nesta seção usam formatos de comando para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).

Para informações sobre o fornecimento do throughput do endpoint e os custos associados, consulte Usando endpoints do Amazon Comprehend.

Criar um endpoint para classificação personalizada

O exemplo a seguir mostra a operação da CreateEndpointAPI usando AWS CLI o.

aws comprehend create-endpoint \ --desired-inference-units number of inference units \ --endpoint-name endpoint name \ --model-arn arn:aws:comprehend:region:account-id:model/example \ --tags Key=My1stTag,Value=Value1

O Amazon Comprehend responde com o seguinte:

{ "EndpointArn": "Arn" }

Executar classificação personalizada em tempo real

Depois de criar um endpoint para seu modelo de classificação personalizado, você usa o endpoint para executar a operação da ClassifyDocumentAPI. Você pode fornecer entrada de texto usando os parâmetrostext ou bytes. Insira os outros tipos de entrada usando o parâmetro bytes.

Para arquivos de imagem e arquivos PDF, você pode usar o parâmetro DocumentReaderConfig para substituir as ações padrão de extração de texto. Para obter detalhes, consulte Configurando opções de extração de texto

Para melhores resultados, combine o tipo de entrada com o tipo de modelo do classificador. A resposta da API inclui um aviso se você enviar um documento nativo para um modelo de texto sem formatação ou um arquivo de texto sem formatação para um modelo de documento nativo. Para ter mais informações, consulte Modelos de classificação de treinamento.

Usando o AWS Command Line Interface

Os exemplos a seguir demonstram como usar o comando CLI classify-document.

Classifique o texto usando o AWS CLI

O exemplo a seguir executa a classificação em tempo real em um bloco de texto.

aws comprehend classify-document \ --endpoint-arn arn:aws:comprehend:region:account-id:endpoint/endpoint name \ --text 'From the Tuesday, April 16th, 1912 edition of The Guardian newspaper: The maiden voyage of the White Star liner Titanic, the largest ship ever launched ended in disaster. The Titanic started her trip from Southampton for New York on Wednesday. Late on Sunday night she struck an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, and several liners were near enough to catch and respond to the call.'

O Amazon Comprehend responde com o seguinte:

{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }

Classifique um documento semiestruturado usando o AWS CLI

Para analisar a classificação personalizada de um arquivo PDF, Word ou de imagem, execute o comando classify-document com o arquivo de entrada no parâmetro bytes.

O exemplo a seguir usa uma imagem como arquivo de entrada. Ele usa a opção fileb para codificar em base 64 os bytes do arquivo de imagem. Para obter mais informações, consulte Objetos binários grandes no Guia AWS Command Line Interface do usuário.

Esse exemplo também passa um arquivo JSON chamado config.json para definir as opções de extração de texto.

$ aws comprehend classify-document \ > --endpoint-arn arn \ > --language-code en \ > --bytes fileb://image1.jpg \ > --document-reader-config file://config.json

O arquivo config.json contém o conteúdo a seguir.

{ "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION", "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT" }

O Amazon Comprehend responde com o seguinte:

{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }

Para obter mais informações, consulte a ClassifyDocumentReferência da API Amazon Comprehend.