Crear un flujo de trabajo de revisión humana (API) - Amazon Textract

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crear un flujo de trabajo de revisión humana (API)

Puede crear un flujo de trabajo de revisión humana o unDefinición del flujo, utilizando Amazon A2I,CreateFlowDefinition.

En este ejemplo, puede utilizar su propio documento en Amazon S3 o descargareste documento de ejemploy guárdelo en su bucket S3.

Asegúrese de que el bucket de Amazon S3 esté en el mismoAWSRegión a la que planeas usar para llamarAnalyzeDocument. Para crear un bucket, siga las instrucciones en Crear un bucket en la Guía del usuario de la consola de Amazon Simple Storage Service.

Requisitos previos

Para utilizar la API de Amazon A2I para crear un flujo de trabajo de revisión humana, debe completar los siguientes requisitos previos:

  • Configure un rol de IAM con permiso para llamar a las operaciones de la API de Amazon A2I y Amazon Textract. Para empezar, puede adjuntar las políticas de AWS, AmazonAugmentedAIFullAccess y AmazonTextractFullAccess a un rol de IAM. Registre el nombre de recursos de Amazon (ARN) de IAM, ya que lo necesitará más adelante.

    Para obtener permisos más detallados al utilizar Amazon Textract, consulteEjemplos de políticas basadas en identidades de Amazon Textract. Para Amazon A2I, consultePermisos y seguridad en la Augmented AI de Amazonen laGuía para desarrolladores de Amazon SageMaker.

  • Cree un equipo de trabajo privado y registre el ARN del equipo de trabajo. Si es un usuario nuevo de Amazon A2I, siga las instrucciones dePaso 1: Crear un equipo de trabajo (consola).

  • Cree una plantilla de tarea del trabajador. Siga las instrucciones enCrear una plantilla de tarea de trabajopara crear una plantilla mediante la consola Amazon A2I. Cuando estés creando la plantilla, eligeExtracción de forma de textoparaTipo de plantilla. En la plantilla, sustituyas3_arncon el ARN de Amazon S3 de su documento. Añadir instrucciones adicionales para el trabajador en<full-instructions header="Instructions"></full-instructions>.

    Si desea obtener una vista previa de la plantilla, asegúrese de que su rol de IAM tenga los permisos descritos enHabilitar vistas previas de plantillas de tareas del trabajador.

    Después de crear la plantilla, registre el ARN de la plantilla de tarea del trabajador.

Usa los recursos que ha creado enRequisitos previospara configurarCreateFlowDefinitionrequest. En esta solicitud, también especificará las condiciones de activación en formato JSON. Para obtener información sobre cómo configurar las condiciones de activación, consulteUtilizar el esquema JSON de condiciones de activación del bucle humano con Amazon Textract.

Creación de un flujo de trabajo de revisión humana (SDK de AWS para Python (Boto3))

Para utilizar este ejemplo, reemplace laredtexto con sus especificaciones y recursos.

En primer lugar, codifique las condiciones de activación en un objeto JSON utilizando el siguiente código. Esto desencadena una revisión humana si Amazon Textract devuelve un puntaje de confianza inferior al 99 paraDirección de correoy su valor, o si devuelve una puntuación de confianza inferior a 90 para cualquier par clave-valor detectado en el documento. Si utiliza el documento de ejemplo que se proporciona en este ejemplo, estas condiciones de activación crean una tarea de revisión humana.

import json humanLoopActivationConditions = json.dumps("{ "Conditions": [ { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Mail Address", "KeyValueBlockConfidenceLessThan": 99, "WordBlockConfidenceLessThan": 99 } }, { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "*", "KeyValueBlockConfidenceLessThan": 90, "WordBlockConfidenceLessThan": 90 } } ] }" )

UsarhumanLoopActivationConditionspara configurar elcreate_flow_definitionrequest. El siguiente ejemplo utiliza el SDK for Python (Boto3) para llamarcreate_flow_definitionen us-west-2 de la región de AWS. Especifica el uso de un equipo de trabajo privado.

response = client.create_flow_definition( FlowDefinitionName='string', HumanLoopRequestSource={ 'AwsManagedHumanLoopRequestSource': "AWS/Textract/AnalyzeDocument/Forms/V1" }, HumanLoopActivationConfig={ 'HumanLoopActivationConditionsConfig': { 'HumanLoopActivationConditions': humanLoopActivationConditions } }, HumanLoopConfig={ 'WorkteamArn': "arn:aws:sagemaker:us-west-2:111122223333:workteam/private-crowd/work-team-name", 'HumanTaskUiArn': "arn:aws:sagemaker:us-west-2:111122223333:human-task-ui/worker-task-template-name", 'TaskTitle': "Add a task title", 'TaskDescription': "Describe your task", 'TaskCount': 1, 'TaskAvailabilityLifetimeInSeconds': 3600, 'TaskTimeLimitInSeconds': 86400, 'TaskKeywords': ["Document Review", "Content Review"] } }, OutputConfig={ 'S3OutputPath': "s3://DOC-EXAMPLE-BUCKET/prefix/", }, RoleArn="arn:aws:iam::111122223333:role/role-name" )