Processamento por meio de CLI - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Processamento por meio de CLI

Processe seu primeiro documento por meio da CLI

Inserir arquivos em um bucket do S3

Antes de processar documentos com o BDA, você deve primeiro carregar seus documentos em um bucket do S3:

Sintaxe

aws s3 cp <source> <target> [--options]

Exemplo:

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Estrutura básica de comando de processamento

Use o invoke-data-automation-async comando para processar arquivos:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Estrutura avançada de comando de processamento

Processamento de vídeo com segmentos de tempo

Para arquivos de vídeo, você pode especificar segmentos de tempo a serem processados:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Usando plantas personalizadas

Você pode especificar esquemas personalizados diretamente no comando:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Adicionando configuração de criptografia

Para aumentar a segurança, você pode adicionar a configuração de criptografia:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Notificações de eventos

Ative EventBridge as notificações para a conclusão do processamento:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Verificando o status do processamento

Use o get-data-automation-status comando para verificar o status do seu trabalho de processamento:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

A resposta incluirá o status atual:

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Recupere os resultados do processamento

Localizando arquivos de saída no S3

Liste os arquivos de saída em seu bucket do S3:

aws s3 ls s3://amzn-s3-demo-bucket/output/

Baixe os resultados para sua máquina local:

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Entendendo a estrutura de saída

A saída normalmente inclui:

  • standard-output.json: Contém resultados de extração padrão

  • custom-output.json: contém resultados de plantas personalizadas

  • metadata.json: contém metadados de processamento e pontuações de confiança

Campos de resposta comuns

A saída padrão normalmente inclui:

  • extractedData: As principais informações extraídas

  • confidence: pontuações de confiança para cada campo extraído

  • metadata: Processando informações, incluindo registros de data e hora e detalhes do modelo

  • boundingBoxes: informações de localização dos elementos detectados (se habilitado)

Tratamento de erros e solução de problemas

Cenários e soluções de erro comuns:

  • URI inválido do S3: verifique se o bucket do S3 existe e se você tem as permissões adequadas

  • Ausente data-automation-profile-arn: esse parâmetro é obrigatório para todas as solicitações de processamento

  • Projeto não encontrado: verifique se o ARN do seu projeto está correto e se o projeto existe

  • Formato de arquivo não suportado: verifique se seu formato de arquivo é compatível com o BDA

Adicionar tags às tarefas de processamento

Você pode adicionar tags para ajudar a organizar e rastrear seus trabalhos de processamento:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"