Processar por meio da CLI - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Processar por meio da CLI

Processar seu primeiro documento por meio da CLI

Inserir arquivos em um bucket do S3

Antes de processar documentos com a BDA, você deve primeiro fazer upload dos documentos em um bucket do S3:

Sintaxe

aws s3 cp <source> <target> [--options]

Exemplo:

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Estrutura básica de comandos de processamento

Use o comando invoke-data-automation-async para processar arquivos:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Estrutura avançada de comando de processamento

Processamento de vídeo com segmentos de tempo

Para arquivos de vídeo, você pode especificar segmentos de tempo a serem processados:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Usar esquemas personalizados

É possível especificar esquemas personalizados diretamente no comando:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Adicionar configuração de criptografia

Para aumentar a segurança, você pode adicionar a configuração de criptografia:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Notificações de eventos

Habilite as notificações do EventBridge para conclusão do processamento:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Verificar o status do processamento

Use o comando get-data-automation-status para verificar o status do trabalho de processamento:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

A resposta incluirá o status atual:

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Recuperar resultados do processamento

Localizar arquivos de saída no S3

Liste os arquivos de saída no bucket do S3:

aws s3 ls s3://amzn-s3-demo-bucket/output/

Faça download dos resultados sua máquina local:

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Noções básicas sobre a estrutura de saída

A saída normalmente inclui:

  • standard-output.json: contém resultados de extração padrão.

  • custom-output.json: contém resultados de esquemas personalizados.

  • metadata.json: contém metadados de processamento e pontuações de confiança.

Campos de resposta comuns

A saída padrão normalmente inclui:

  • extractedData: as principais informações extraídas.

  • confidence: pontuações de confiança para cada campo extraído.

  • metadata: processamento de informações, como carimbos de data/hora e detalhes do modelo.

  • boundingBoxes: informações de localização dos elementos detectados (se habilitado).

Tratamento de erros e solução de problemas

Cenários e soluções de erro comuns:

  • URI inválido do S3: verifique se o bucket do S3 existe e se você tem as permissões adequadas.

  • data-automation-profile-arn ausente: esse parâmetro é obrigatório para todas as solicitações de processamento.

  • Projeto não encontrado: verifique se o ARN do projeto está correto e se o projeto existe.

  • Formato de arquivo não compatível: verifique se o formato do arquivo é compatível com a BDA.

Adicionar tags a trabalhos de processamento

Você pode adicionar tags para ajudar a organizar e rastrear seus trabalhos de processamento:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"