Crie seu primeiro projeto de automação de dados Referência completa de parâmetros Criando um blueprint Usando seu Blueprint Documentos do processo Verifique o status do processamento Recuperar resultados

Usando a CLI Amazon Bedrock de automação de dados

O recurso Amazon Bedrock Data Automation (BDA) fornece um fluxo de trabalho CLI simplificado para processar seus dados. Para todas as modalidades, esse fluxo de trabalho consiste em três etapas principais: criar um projeto, criar esquemas para saída personalizada e processar documentos. Este guia mostra os principais comandos da CLI para trabalhar com o BDA.

Crie seu primeiro projeto de automação de dados

Para começar a trabalhar com o BDA, primeiro crie um projeto usando o create-data-automation-project comando.

Considere este exemplo de passaporte que processaremos:

Ao criar um projeto, você deve definir suas configurações para o tipo de arquivo que você pretende processar. O comando a seguir representa um exemplo prático mínimo para criar um projeto de processamento de imagem:


aws bedrock-data-automation create-data-automation-project \
    --project-name "ImageProcessingProject" \
    --standard-output-configuration '{
        "image": {
            "extraction": {
                "category": {
                    "state": "ENABLED",
                    "types": ["TEXT_DETECTION"]
                },
                "boundingBox": {
                    "state": "ENABLED"
                }
            },
            "generativeField": {
                "state": "ENABLED"
            }
        }
    }'

O comando valida a configuração de entrada e cria um novo projeto com um ARN exclusivo. Uma resposta incluiria o ARN do projeto e o estágio:


{
    "projectArn": "Amazon Resource Name (ARN)",
    "projectStage": "DEVELOPMENT",
    "status": "IN_PROGRESS"
}

Se um projeto for criado sem parâmetros, as configurações padrão serão aplicadas. Por exemplo, ao processar imagens, o resumo de imagens e a detecção de texto serão ativados por padrão.

Referência completa de parâmetros

A tabela a seguir mostra todos os parâmetros disponíveis para o create-data-automation-project comando:

Parâmetros para create-data-automation-project
Parameter	Obrigatório	Padrão	Descrição
`--project-name`	Sim	N/D	Nome do projeto de automação de dados
`--project-stage`	Não	AO VIVO	Etapa do projeto (DESENVOLVIMENTO ou AO VIVO)
`--standard-output-configuration`	Sim	N/D	Configuração JSON para processamento de saída padrão
`--custom-output-configuration`	Não	N/D	Configuração JSON para processamento de saída personalizado
`--encryption-configuration`	Não	N/D	Configurações de criptografia para o projeto
`--client-token`	Não	Gerado automaticamente	Identificador exclusivo para idempotência da solicitação

Criando um blueprint

Depois de criar um projeto, você pode criar um Blueprint para definir a estrutura do seu processamento de dados usando o create-blueprint comando.

Aqui está um exemplo prático mínimo para criar um plano sob medida para o processamento de passaportes:


aws bedrock-data-automation create-blueprint \
    --blueprint-name "passport-blueprint" \
    --type "IMAGE" \
    --blueprint-stage "DEVELOPMENT" \
    --schema '{
        "class": "Passport",
        "description": "Blueprint for processing passport images",
        "properties": {
            "passport_number": {
                "type": "string",
                "inferenceType": "explicit",
                "instruction": "The passport identification number"
            },
            "full_name": {
                "type": "string",
                "inferenceType": "explicit",
                "instruction": "The full name of the passport holder"
            }
        }
    }'

O comando cria um novo Blueprint com o esquema especificado. Em seguida, você pode usar esse Blueprint ao processar documentos para extrair dados estruturados de acordo com seu esquema definido.

Usando seu Blueprint

Adicionar um blueprint a um projeto

Para adicionar um Blueprint ao seu projeto, use o update-data-automation-project comando:


aws bedrock-data-automation update-data-automation-project \
    --project-arn "Amazon Resource Name (ARN)" \
    --standard-output-configuration '{
        "image": {
            "extraction": {
                "category": {
                    "state": "ENABLED",
                    "types": ["TEXT_DETECTION"]
                },
                "boundingBox": {
                    "state": "ENABLED"
                }
            },
            "generativeField": {
                "state": "ENABLED",
                "types": ["IMAGE_SUMMARY"]
            }
        }
    }' \
    --custom-output-configuration '{
        "blueprints": [
            {
                "blueprintArn": "Amazon Resource Name (ARN)",
                "blueprintVersion": "1",
                "blueprintStage": "LIVE"
            }
        ]
    }'

Verificando a integração do Blueprint

Você pode verificar a integração do Blueprint usando o get-data-automation-project comando:


aws bedrock-data-automation get-data-automation-project \
    --project-arn "Amazon Resource Name (ARN)"

Gerenciando vários Blueprints

Use o list-blueprints comando para visualizar todos os seus Blueprints:


aws bedrock-data-automation list-blueprints

Documentos do processo

Depois de configurar um projeto, você pode processar documentos usando o invoke-data-automation-async comando:


aws bedrock-data-automation-runtime invoke-data-automation-async \
    --input-configuration '{
        "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf"
    }' \
    --output-configuration '{
        "s3Uri": "s3://my-bda-documents/output/"
    }' \
    --data-automation-configuration '{
        "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
        "stage": "LIVE"
    }' \
    --data-automation-profile-arn "Amazon Resource Name (ARN)"

O comando retorna um ARN de invocação que você pode usar para verificar o status do processamento:


{
    "invocationArn": "Amazon Resource Name (ARN)"
}

Verifique o status do processamento

Para verificar o status do seu trabalho de processamento, use o get-data-automation-status comando:


aws bedrock-data-automation-runtime get-data-automation-status \
    --invocation-arn "Amazon Resource Name (ARN)"

O comando retorna o status atual da tarefa de processamento:


{
    "status": "COMPLETED",
    "creationTime": "2025-07-09T12:34:56.789Z",
    "lastModifiedTime": "2025-07-09T12:45:12.345Z",
    "outputLocation": "s3://my-bda-documents/output/efgh5678/"
}

Os valores de status possíveis incluem:

IN_PROGRESS: O trabalho de processamento está sendo executado no momento.
COMPLETED: O trabalho de processamento foi concluído com êxito.
FAILED: O trabalho de processamento falhou. Verifique a resposta para ver os detalhes do erro.
STOPPED: o trabalho de processamento foi interrompido manualmente.

Recuperar resultados

Depois que o processamento estiver concluído, você poderá listar os arquivos de saída em seu bucket do S3:


aws s3 ls s3://my-bda-documents/output/efgh5678/

Para baixar os resultados para sua máquina local:


aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

A saída inclui dados estruturados com base na configuração do seu projeto e em todos os Blueprints que você aplicou.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Pré-requisitos para usar o Bedrock Data Automation

CLI de operações do Blueprint