Creare un flusso di lavoro di revisione umana (API) - Amazon Textract

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creare un flusso di lavoro di revisione umana (API)

È possibile creare un flusso di lavoro di revisione umana o undefinizione di flusso, utilizzando Amazon A2I,CreateFlowDefinitionoperazione.

Per questo esempio, puoi utilizzare il tuo documento in Amazon S3 oppure scaricarequesto documento di esempioe conservalo nel tuo secchio S3.

Verificare che il bucket Amazon S3 sia nello stessoAWSRegione che intendi utilizzare per chiamareAnalyzeDocument. Per creare un bucket, segui le istruzioni riportate in Creazione di un bucket nella Guida per l'utente di Amazon Simple Storage Service Console.

Prerequisiti

Per utilizzare l'API Amazon A2I per creare un flusso di lavoro di revisione umana, è necessario completare i seguenti prerequisiti:

  • Configurare un ruolo IAM con l'autorizzazione a chiamare le operazioni Amazon A2I e Amazon Textract API. Per iniziare, puoi allegare le politiche AWS, AmazonAugmentedAIFullAccess e AmazonTextractFullAccess a un ruolo IAM. Registra l'ARN (Amazon Resources Name) IAM perché sarà necessario in un secondo momento.

    Per autorizzazioni più granulari quando si utilizza Amazon Textract, consultaEsempi di policy basate su identità Amazon Textract. Per Amazon A2I, consulta.Autorizzazioni e sicurezza nell'AI Augmented Amazon AugmentednellaGuida per gli sviluppatori di Amazon SageMaker.

  • Crea un team di lavoro privato e registra l'ARN del team di lavoro. Se sei un nuovo utente di Amazon A2I, segui le istruzioni riportate inFase 1: Creazione di un team di lavoro (console).

  • Creare un modello di attività lavoratore. Segui le istruzioni inCreare un modello di attività lavoratoreper creare un modello utilizzando la console Amazon A2I. Quando crei il modello, scegliEstrazione di forme testualiperTipo di modello. Nel modello, sostituiscis3_arncon l'ARN Amazon S3 del documento. Aggiungi ulteriori istruzioni per il lavoratore in<full-instructions header="Instructions"></full-instructions>.

    Se desideri visualizzare in anteprima il modello, assicurati che il ruolo IAM disponga delle autorizzazioni descritte inAbilitazione delle anteprime dei modelli di attività lavoratore.

    Dopo aver creato il modello, registrare il modello di attività lavoratore ARN.

Utilizzi le risorse create inPrerequisitiper configurare ilCreateFlowDefinition. In questa richiesta, specificate anche le condizioni di attivazione in formato JSON. Per informazioni su come configurare le condizioni di attivazione, consulta.Utilizzare lo schema JSON per condizioni attivazione del ciclo umano con Amazon Textract.

Creazione di un flusso di lavoro di revisione umana (SDK AWS per Python (Boto3))

Per utilizzare questo esempio, sostituire l'redcon le specifiche e le risorse dell'utente.

Innanzitutto, codifica le condizioni di attivazione in un oggetto JSON utilizzando il seguente codice. Questo fa scattare una recensione umana se Amazon Textract restituisce un punteggio di confidenza inferiore a 99 perIndirizzo e-maile il suo valore, o se restituisce un punteggio di confidenza inferiore a 90 per qualsiasi coppia chiave-valore rilevata nel documento. Se si utilizza il documento di esempio fornito in questo esempio, queste condizioni di attivazione creano un'attività di revisione umana.

import json humanLoopActivationConditions = json.dumps("{ "Conditions": [ { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Mail Address", "KeyValueBlockConfidenceLessThan": 99, "WordBlockConfidenceLessThan": 99 } }, { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "*", "KeyValueBlockConfidenceLessThan": 90, "WordBlockConfidenceLessThan": 90 } } ] }" )

UtilizzahumanLoopActivationConditionsper configurare ilcreate_flow_definition. L'esempio seguente utilizza l'SDK for Python (Boto3) per chiamarecreate_flow_definitionnella regione AWS us-west-2. Specifica l'utilizzo di un team di lavoro privato.

response = client.create_flow_definition( FlowDefinitionName='string', HumanLoopRequestSource={ 'AwsManagedHumanLoopRequestSource': "AWS/Textract/AnalyzeDocument/Forms/V1" }, HumanLoopActivationConfig={ 'HumanLoopActivationConditionsConfig': { 'HumanLoopActivationConditions': humanLoopActivationConditions } }, HumanLoopConfig={ 'WorkteamArn': "arn:aws:sagemaker:us-west-2:111122223333:workteam/private-crowd/work-team-name", 'HumanTaskUiArn': "arn:aws:sagemaker:us-west-2:111122223333:human-task-ui/worker-task-template-name", 'TaskTitle': "Add a task title", 'TaskDescription': "Describe your task", 'TaskCount': 1, 'TaskAvailabilityLifetimeInSeconds': 3600, 'TaskTimeLimitInSeconds': 86400, 'TaskKeywords': ["Document Review", "Content Review"] } }, OutputConfig={ 'S3OutputPath': "s3://DOC-EXAMPLE-BUCKET/prefix/", }, RoleArn="arn:aws:iam::111122223333:role/role-name" )