Etapa 3: executando trabalhos de análise em documentos no Amazon S3 - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Etapa 3: executando trabalhos de análise em documentos no Amazon S3

Depois de armazenar os dados no Amazon S3, você pode começar a executar trabalhos de análise no Amazon Comprehend. Um trabalho de análise de sentimentos determina o clima geral de um documento (positivo, negativo, neutro ou misto). Um trabalho de análise de entidades extrai os nomes de objetos do mundo real de um documento. Esses objetos incluem pessoas, lugares, títulos, eventos, datas, quantidades, produtos e organizações. Nesta etapa, você executa dois trabalhos de análise do Amazon Comprehend para extrair o sentimento e as entidades do conjunto de dados de amostra.

Pré-requisitos

Antes de começar, faça o seguinte:

Analise sentimentos e entidades

O primeiro trabalho que você executa analisa o sentimento de cada avaliação do cliente no conjunto de dados de amostra. O segundo trabalho extrai as entidades em cada avaliação do cliente. Você pode realizar trabalhos de análise do Amazon Comprehend usando o console do Amazon Comprehend ou o AWS CLI.

dica

Verifique se você está em uma AWS região que ofereça suporte ao Amazon Comprehend. Para obter mais informações, consulte a Tabela de regiões no Guia Global de Infraestrutura.

Ao usar o console do Amazon Comprehend, você cria um trabalho por vez. Você precisa repetir as etapas a seguir para executar um trabalho de análise de sentimentos e de entidades. Observe que para o primeiro trabalho, você cria uma IAM função, mas para o segundo trabalho, você pode reutilizar a IAM função do primeiro trabalho. Você pode reutilizar a IAM função, desde que use o mesmo bucket e pastas do S3.

Para executar trabalhos de análise de sentimentos e entidades (console)
  1. Certifique-se de que você esteja na mesma Região em que você criou o bucket do Amazon Simple Storage Service (Amazon S3). Se você estiver em outra região, na barra de navegação, escolha a AWS região em que você criou seu bucket do S3 no seletor de regiões.

  2. Abra o console do Amazon Comprehend em https://console.aws.amazon.com/comprehend/

  3. Escolha Executar o Amazon Comprehend).

  4. No painel de navegação, escolha Trabalhos de análise.

  5. Escolha Criar trabalho.

  6. Na seção Configurações de trabalho, faça o seguinte:

    1. Em Nome, insira reviews-sentiment-analysis.

    2. Em Tipo de análise, escolha Sentiment.

    3. Em Idioma, escolha Inglês.

    4. Deixe a configuração de Criptografia do trabalho desabilitada.

  7. Na seção Dados de entrada, faça o seguinte:

    1. Em Fonte de dados, escolha Meus documentos.

    2. Para a Local do S3, escolha Procurar no S3 e, em seguida, escolha seu bucket na lista de buckets.

    3. Em seu bucket do S3, em Objetos, escolha sua pasta input.

    4. Na pasta input, escolha o conjunto de dados de amostra amazon-reviews.csv e, em seguida, Escolher.

    5. Em Formato de entrada, escolha Um documento por linha.

  8. Na seção Dados de saída, faça o seguinte:

    1. Para a Local do S3, escolha Procurar no S3 e, em seguida, escolha seu bucket na lista de buckets.

    2. Em seu bucket do S3, em Objetos, escolha a pasta output e, em seguida, Escolher.

    3. Deixe a Criptografia desabilitada.

  9. Na seção Permissões de acesso, faça o seguinte:

    1. Em IAMFunção, escolha Criar uma IAM função.

    2. Em Permissões para acessar, escolha Buckets do S3 de entrada e saída.

    3. Em Sufixo do nome, insira comprehend-access-role. Esse perfil fornece acesso ao bucket do Amazon S3.

  10. Escolha Criar trabalho.

  11. Repita as etapas de 1 a 10 para criar um trabalho de análise de entidades. Faça as seguintes alterações em:

    1. Em Configurações de trabalho, em Nome, insira reviews-entities-analysis.

    2. Em Configurações de trabalho, em Tipo de análise, escolha Entidades.

    3. Em Permissões de acesso, escolha Usar uma IAM função existente. Em Nome do perfil, escolha AmazonComprehendServiceRole-comprehend-access-role (essa é a mesmo perfil que você criou para o trabalho de sentimento).

Você usa os start-sentiment-detection-job e os comandos start-entities-detection-job para executar trabalhos de análise de sentimentos e entidades. Depois de executar cada comando, o AWS CLI mostra um JSON objeto com um JobId valor que permite acessar detalhes sobre o trabalho, incluindo a localização de saída do S3.

Para executar trabalhos de análise de sentimentos e entidades ()AWS CLI
  1. Inicie um trabalho de análise de sentimentos executando o comando a seguir no AWS CLI. arn:aws:iam::123456789012:role/comprehend-access-roleSubstitua pela IAM função ARN que você copiou anteriormente para um editor de texto. Se sua AWS CLI região padrão for diferente da região na qual você criou seu bucket do Amazon S3, inclua o --region parâmetro e us-east-1 substitua pela região em que seu bucket reside.

    aws comprehend start-sentiment-detection-job --input-data-config S3Uri=s3://amzn-s3-demo-bucket/input/ --output-data-config S3Uri=s3://amzn-s3-demo-bucket/output/ --data-access-role-arn arn:aws:iam::123456789012:role/comprehend-access-role --job-name reviews-sentiment-analysis --language-code en [--region us-east-1]
  2. Depois de enviar o trabalho, copie o JobId e salve-o em um editor de texto. Você precisará do JobId para encontrar os arquivos de saída do trabalho de análise.

  3. Inicie um trabalho de análise de entidades executando o comando a seguir.

    aws comprehend start-entities-detection-job --input-data-config S3Uri=s3://amzn-s3-demo-bucket/input/ --output-data-config S3Uri=s3://amzn-s3-demo-bucket/output/ --data-access-role-arn arn:aws:iam::123456789012:role/comprehend-access-role --job-name reviews-entities-analysis --language-code en [--region us-east-1]
  4. Depois de enviar o trabalho, copie o JobId e salve-o em um editor de texto.

  5. Verifique o status dos seus trabalhos. Você pode ver o progresso de um trabalho acompanhando seu JobId.

    Para acompanhar o andamento do trabalho de análise de sentimentos, execute o comando a seguir. Substitua sentiment-job-id pelo JobId que você copiou depois de executar sua análise de sentimentos.

    aws comprehend describe-sentiment-detection-job --job-id sentiment-job-id

    Para monitorar seu trabalho de análise de entidades, execute o comando a seguir. Substitua entities-job-id pelo JobId que você copiou depois de executar sua análise de entidades.

    aws comprehend describe-entities-detection-job --job-id entities-job-id

    É preciso alguns minutos para que JobStatus seja exibido como COMPLETED.

Você concluiu trabalhos de análise de sentimentos e entidades. Ambos os trabalhos devem ser concluídos antes de você passar para a próxima etapa. A conclusão do trabalho pode demorar vários minutos.