As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Processar por meio da CLI
Processar seu primeiro documento por meio da CLI
Inserir arquivos em um bucket do S3
Antes de processar documentos com a BDA, você deve primeiro fazer upload dos documentos em um bucket do S3:
Sintaxe
aws s3 cp <source> <target> [--options]
Exemplo:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Estrutura básica de comandos de processamento
Use o comando invoke-data-automation-async para processar arquivos:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Estrutura avançada de comando de processamento
Processamento de vídeo com segmentos de tempo
Para arquivos de vídeo, você pode especificar segmentos de tempo a serem processados:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Usar esquemas personalizados
É possível especificar esquemas personalizados diretamente no comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Adicionar configuração de criptografia
Para aumentar a segurança, você pode adicionar a configuração de criptografia:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Notificações de eventos
Habilite as notificações do EventBridge para conclusão do processamento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Verificar o status do processamento
Use o comando get-data-automation-status para verificar o status do trabalho de processamento:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
A resposta incluirá o status atual:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Recuperar resultados do processamento
Localizar arquivos de saída no S3
Liste os arquivos de saída no bucket do S3:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Faça download dos resultados sua máquina local:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Noções básicas sobre a estrutura de saída
A saída normalmente inclui:
-
standard-output.json: contém resultados de extração padrão. -
custom-output.json: contém resultados de esquemas personalizados. -
metadata.json: contém metadados de processamento e pontuações de confiança.
Campos de resposta comuns
A saída padrão normalmente inclui:
-
extractedData: as principais informações extraídas. -
confidence: pontuações de confiança para cada campo extraído. -
metadata: processamento de informações, como carimbos de data/hora e detalhes do modelo. -
boundingBoxes: informações de localização dos elementos detectados (se habilitado).
Tratamento de erros e solução de problemas
Cenários e soluções de erro comuns:
-
URI inválido do S3: verifique se o bucket do S3 existe e se você tem as permissões adequadas.
-
data-automation-profile-arn ausente: esse parâmetro é obrigatório para todas as solicitações de processamento.
-
Projeto não encontrado: verifique se o ARN do projeto está correto e se o projeto existe.
-
Formato de arquivo não compatível: verifique se o formato do arquivo é compatível com a BDA.
Adicionar tags a trabalhos de processamento
Você pode adicionar tags para ajudar a organizar e rastrear seus trabalhos de processamento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"