Usando a CLI Amazon Bedrock de automação de dados - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usando a CLI Amazon Bedrock de automação de dados

O recurso Amazon Bedrock Data Automation (BDA) fornece um fluxo de trabalho CLI simplificado para processar seus dados. Para todas as modalidades, esse fluxo de trabalho consiste em três etapas principais: criar um projeto, criar esquemas para saída personalizada e processar documentos. Este guia mostra os principais comandos da CLI para trabalhar com o BDA.

Crie seu primeiro projeto de automação de dados

Para começar a trabalhar com o BDA, primeiro crie um projeto usando o create-data-automation-project comando.

Considere este exemplo de passaporte que processaremos:

Ao criar um projeto, você deve definir suas configurações para o tipo de arquivo que você pretende processar. O comando a seguir representa um exemplo prático mínimo para criar um projeto de processamento de imagem:

aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'

O comando valida a configuração de entrada e cria um novo projeto com um ARN exclusivo. Uma resposta incluiria o ARN do projeto e o estágio:

{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }

Se um projeto for criado sem parâmetros, as configurações padrão serão aplicadas. Por exemplo, ao processar imagens, o resumo de imagens e a detecção de texto serão ativados por padrão.

Referência completa de parâmetros

A tabela a seguir mostra todos os parâmetros disponíveis para o create-data-automation-project comando:

Parâmetros para create-data-automation-project
Parameter Obrigatório Padrão Descrição
--project-name Sim N/D Nome do projeto de automação de dados
--project-stage Não AO VIVO Etapa do projeto (DESENVOLVIMENTO ou AO VIVO)
--standard-output-configuration Sim N/D Configuração JSON para processamento de saída padrão
--custom-output-configuration Não N/D Configuração JSON para processamento de saída personalizado
--encryption-configuration Não N/D Configurações de criptografia para o projeto
--client-token Não Gerado automaticamente Identificador exclusivo para idempotência da solicitação

Criando um blueprint

Depois de criar um projeto, você pode criar um Blueprint para definir a estrutura do seu processamento de dados usando o create-blueprint comando.

Aqui está um exemplo prático mínimo para criar um plano sob medida para o processamento de passaportes:

aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'

O comando cria um novo Blueprint com o esquema especificado. Em seguida, você pode usar esse Blueprint ao processar documentos para extrair dados estruturados de acordo com seu esquema definido.

Usando seu Blueprint

Adicionar um blueprint a um projeto

Para adicionar um Blueprint ao seu projeto, use o update-data-automation-project comando:

aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'

Verificando a integração do Blueprint

Você pode verificar a integração do Blueprint usando o get-data-automation-project comando:

aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"

Gerenciando vários Blueprints

Use o list-blueprints comando para visualizar todos os seus Blueprints:

aws bedrock-data-automation list-blueprints

Documentos do processo

Depois de configurar um projeto, você pode processar documentos usando o invoke-data-automation-async comando:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

O comando retorna um ARN de invocação que você pode usar para verificar o status do processamento:

{ "invocationArn": "Amazon Resource Name (ARN)" }

Verifique o status do processamento

Para verificar o status do seu trabalho de processamento, use o get-data-automation-status comando:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

O comando retorna o status atual da tarefa de processamento:

{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }

Os valores de status possíveis incluem:

  • IN_PROGRESS: O trabalho de processamento está sendo executado no momento.

  • COMPLETED: O trabalho de processamento foi concluído com êxito.

  • FAILED: O trabalho de processamento falhou. Verifique a resposta para ver os detalhes do erro.

  • STOPPED: o trabalho de processamento foi interrompido manualmente.

Recuperar resultados

Depois que o processamento estiver concluído, você poderá listar os arquivos de saída em seu bucket do S3:

aws s3 ls s3://my-bda-documents/output/efgh5678/

Para baixar os resultados para sua máquina local:

aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

A saída inclui dados estruturados com base na configuração do seu projeto e em todos os Blueprints que você aplicou.