As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Processamento por meio de CLI
Processe seu primeiro documento por meio da CLI
Inserir arquivos em um bucket do S3
Antes de processar documentos com o BDA, você deve primeiro carregar seus documentos em um bucket do S3:
Sintaxe
aws s3 cp <source> <target> [--options]
Exemplo:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Estrutura básica de comando de processamento
Use o invoke-data-automation-async
comando para processar arquivos:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Estrutura avançada de comando de processamento
Processamento de vídeo com segmentos de tempo
Para arquivos de vídeo, você pode especificar segmentos de tempo a serem processados:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Usando plantas personalizadas
Você pode especificar esquemas personalizados diretamente no comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Adicionando configuração de criptografia
Para aumentar a segurança, você pode adicionar a configuração de criptografia:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Notificações de eventos
Ative EventBridge as notificações para a conclusão do processamento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Verificando o status do processamento
Use o get-data-automation-status
comando para verificar o status do seu trabalho de processamento:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
A resposta incluirá o status atual:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Recupere os resultados do processamento
Localizando arquivos de saída no S3
Liste os arquivos de saída em seu bucket do S3:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Baixe os resultados para sua máquina local:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Entendendo a estrutura de saída
A saída normalmente inclui:
-
standard-output.json
: Contém resultados de extração padrão -
custom-output.json
: contém resultados de plantas personalizadas -
metadata.json
: contém metadados de processamento e pontuações de confiança
Campos de resposta comuns
A saída padrão normalmente inclui:
-
extractedData
: As principais informações extraídas -
confidence
: pontuações de confiança para cada campo extraído -
metadata
: Processando informações, incluindo registros de data e hora e detalhes do modelo -
boundingBoxes
: informações de localização dos elementos detectados (se habilitado)
Tratamento de erros e solução de problemas
Cenários e soluções de erro comuns:
-
URI inválido do S3: verifique se o bucket do S3 existe e se você tem as permissões adequadas
-
Ausente data-automation-profile-arn: esse parâmetro é obrigatório para todas as solicitações de processamento
-
Projeto não encontrado: verifique se o ARN do seu projeto está correto e se o projeto existe
-
Formato de arquivo não suportado: verifique se seu formato de arquivo é compatível com o BDA
Adicionar tags às tarefas de processamento
Você pode adicionar tags para ajudar a organizar e rastrear seus trabalhos de processamento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"