Criar um fluxo de trabalho de revisão humana (API) - Amazon Textract

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar um fluxo de trabalho de revisão humana (API)

É possível criar um fluxo de trabalho de revisão humana ou umDefinição de fluxo, usando o Amazon A2I,CreateFlowDefinitionoperação.

Para este exemplo, você pode usar seu próprio documento no Amazon S3 ou fazer o downloadeste exemplo de documentoe armazene-o no seu bucket do S3.

Verifique se seu bucket do Amazon S3 está no mesmoAWSRegião que você planeja usar para ligarAnalyzeDocument. Para criar um bucket, siga as instruções em Criar um bucket no Guia do usuário do console do Amazon Simple Storage Service.

Pré-requisitos

Para usar a API do Amazon A2I para criar um fluxo de trabalho de revisão humana, você deve preencher os seguintes pré-requisitos:

  • Configure uma função do IAM com permissão para chamar as operações de API do Amazon A2I e Amazon Textract. Para começar, você pode anexar as políticas da AWS, AmazonAugmentedAIFullAccess e AmazonTextractFullAccess a uma função do IAM. Registre a função do IAM Amazon Resources Name (ARN) porque você precisará dela mais tarde.

    Para obter permissões mais granulares ao usar o Amazon Textract, consulteExemplos de políticas baseadas em identidade do Amazon Textract. Para o Amazon A2I, consultePermissões e segurança na Augmented AI da AmazonnoGuia do desenvolvedor do Amazon SageMaker.

  • Crie uma equipe de trabalho particular e registre o ARN da equipe de trabalho. Se você for um novo usuário do Amazon A2I, siga as instruções emEtapa 1: Criar uma equipe de trabalho (Console).

  • Crie um modelo de tarefa de operador. Siga as instruções emCriar um modelo de tarefa de operadorpara criar um modelo usando o console Amazon A2I. Quando você estiver criando o modelo, escolhaExtração em forma de textopeloTipo de modelo. No modelo, substituas3_arncom o ARN do Amazon S3 do documento. Adicione outras instruções do trabalhador em<full-instructions header="Instructions"></full-instructions>.

    Se você quiser visualizar o modelo, verifique se a sua função do IAM tem as permissões descritas emHabilitar visualizações do modelo de tarefa de operador.

    Depois de criar seu modelo, registre o ARN do modelo de tarefa do trabalhador.

Usar recursos criados noPré-requisitosPara configurar oCreateFlowDefinitionsolicitação. Nesta solicitação, você também especifica condições de ativação no formato JSON. Para saber como configurar suas condições de ativação, consulteUsar o esquema JSON de condições de ativação de loop humano com o Amazon Textract.

Criando um fluxo de trabalho de revisão humana (AWS SDK for Python (Boto3))

Para usar esse exemplo, substitua avermelhoTexto com suas especificações e recursos.

Primeiro, codifique suas condições de ativação em um objeto JSON usando o código a seguir. Isso aciona uma avaliação humana se o Amazon Textract retornar uma pontuação de confiança menor que 99 paraEndereço de correioe seu valor, ou se retornar uma pontuação de confiança menor que 90 para qualquer par de valores-chave detectado no documento. Se você estiver usando o documento de amostra fornecido neste exemplo, essas condições de ativação criarão uma tarefa de revisão humana.

import json humanLoopActivationConditions = json.dumps("{ "Conditions": [ { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Mail Address", "KeyValueBlockConfidenceLessThan": 99, "WordBlockConfidenceLessThan": 99 } }, { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "*", "KeyValueBlockConfidenceLessThan": 90, "WordBlockConfidenceLessThan": 90 } } ] }" )

Usar ohumanLoopActivationConditionspara configurar ocreate_flow_definitionsolicitação. O exemplo a seguir usa o SDK for Python (Boto3) para chamarcreate_flow_definitionna região us-west-2 da AWS. Ele especifica o uso de uma equipe de trabalho privada.

response = client.create_flow_definition( FlowDefinitionName='string', HumanLoopRequestSource={ 'AwsManagedHumanLoopRequestSource': "AWS/Textract/AnalyzeDocument/Forms/V1" }, HumanLoopActivationConfig={ 'HumanLoopActivationConditionsConfig': { 'HumanLoopActivationConditions': humanLoopActivationConditions } }, HumanLoopConfig={ 'WorkteamArn': "arn:aws:sagemaker:us-west-2:111122223333:workteam/private-crowd/work-team-name", 'HumanTaskUiArn': "arn:aws:sagemaker:us-west-2:111122223333:human-task-ui/worker-task-template-name", 'TaskTitle': "Add a task title", 'TaskDescription': "Describe your task", 'TaskCount': 1, 'TaskAvailabilityLifetimeInSeconds': 3600, 'TaskTimeLimitInSeconds': 86400, 'TaskKeywords': ["Document Review", "Content Review"] } }, OutputConfig={ 'S3OutputPath': "s3://DOC-EXAMPLE-BUCKET/prefix/", }, RoleArn="arn:aws:iam::111122223333:role/role-name" )