As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Usando a CLI Amazon Bedrock de automação de dados
O recurso Amazon Bedrock Data Automation (BDA) fornece um fluxo de trabalho CLI simplificado para processar seus dados. Para todas as modalidades, esse fluxo de trabalho consiste em três etapas principais: criar um projeto, criar esquemas para saída personalizada e processar documentos. Este guia mostra os principais comandos da CLI para trabalhar com o BDA.
Crie seu primeiro projeto de automação de dados
Para começar a trabalhar com o BDA, primeiro crie um projeto usando o create-data-automation-project
comando.
Considere este exemplo de passaporte que processaremos:

Ao criar um projeto, você deve definir suas configurações para o tipo de arquivo que você pretende processar. O comando a seguir representa um exemplo prático mínimo para criar um projeto de processamento de imagem:
aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'
O comando valida a configuração de entrada e cria um novo projeto com um ARN exclusivo. Uma resposta incluiria o ARN do projeto e o estágio:
{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }
Se um projeto for criado sem parâmetros, as configurações padrão serão aplicadas. Por exemplo, ao processar imagens, o resumo de imagens e a detecção de texto serão ativados por padrão.
Referência completa de parâmetros
A tabela a seguir mostra todos os parâmetros disponíveis para o create-data-automation-project
comando:
Parameter | Obrigatório | Padrão | Descrição |
---|---|---|---|
--project-name |
Sim | N/D | Nome do projeto de automação de dados |
--project-stage |
Não | AO VIVO | Etapa do projeto (DESENVOLVIMENTO ou AO VIVO) |
--standard-output-configuration |
Sim | N/D | Configuração JSON para processamento de saída padrão |
--custom-output-configuration |
Não | N/D | Configuração JSON para processamento de saída personalizado |
--encryption-configuration |
Não | N/D | Configurações de criptografia para o projeto |
--client-token |
Não | Gerado automaticamente | Identificador exclusivo para idempotência da solicitação |
Criando um blueprint
Depois de criar um projeto, você pode criar um Blueprint para definir a estrutura do seu processamento de dados usando o create-blueprint
comando.
Aqui está um exemplo prático mínimo para criar um plano sob medida para o processamento de passaportes:
aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'
O comando cria um novo Blueprint com o esquema especificado. Em seguida, você pode usar esse Blueprint ao processar documentos para extrair dados estruturados de acordo com seu esquema definido.
Usando seu Blueprint
Adicionar um blueprint a um projeto
Para adicionar um Blueprint ao seu projeto, use o update-data-automation-project
comando:
aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'
Verificando a integração do Blueprint
Você pode verificar a integração do Blueprint usando o get-data-automation-project
comando:
aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"
Gerenciando vários Blueprints
Use o list-blueprints
comando para visualizar todos os seus Blueprints:
aws bedrock-data-automation list-blueprints
Documentos do processo
Depois de configurar um projeto, você pode processar documentos usando o invoke-data-automation-async
comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
O comando retorna um ARN de invocação que você pode usar para verificar o status do processamento:
{ "invocationArn": "Amazon Resource Name (ARN)" }
Verifique o status do processamento
Para verificar o status do seu trabalho de processamento, use o get-data-automation-status
comando:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
O comando retorna o status atual da tarefa de processamento:
{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }
Os valores de status possíveis incluem:
-
IN_PROGRESS
: O trabalho de processamento está sendo executado no momento. -
COMPLETED
: O trabalho de processamento foi concluído com êxito. -
FAILED
: O trabalho de processamento falhou. Verifique a resposta para ver os detalhes do erro. -
STOPPED
: o trabalho de processamento foi interrompido manualmente.
Recuperar resultados
Depois que o processamento estiver concluído, você poderá listar os arquivos de saída em seu bucket do S3:
aws s3 ls s3://my-bda-documents/output/efgh5678/
Para baixar os resultados para sua máquina local:
aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive
A saída inclui dados estruturados com base na configuração do seu projeto e em todos os Blueprints que você aplicou.