Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Procesamiento mediante CLI
Procese su primer documento a través de CLI
Introduzca los archivos en un bucket de S3
Antes de procesar documentos con BDA, primero debe cargarlos en un depósito de S3:
Sintaxis
aws s3 cp <source> <target> [--options]
Ejemplo:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Estructura básica de comandos de procesamiento
Utilice el invoke-data-automation-async
comando para procesar archivos:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Estructura de comandos de procesamiento avanzada
Procesamiento de vídeo con segmentos de tiempo
En el caso de los archivos de vídeo, puede especificar los segmentos de tiempo que se van a procesar:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Uso de planos personalizados
Puede especificar planos personalizados directamente en el comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Añadir una configuración de cifrado
Para mejorar la seguridad, puede añadir una configuración de cifrado:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Notificaciones de eventos
Habilite EventBridge las notificaciones para completar el procesamiento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Comprobar el estado del procesamiento
Utilice el get-data-automation-status
comando para comprobar el estado de su trabajo de procesamiento:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
La respuesta incluirá el estado actual:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Recupere los resultados del procesamiento
Localizar los archivos de salida en S3
Enumere los archivos de salida de su bucket de S3:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Descargue los resultados en su máquina local:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Comprensión de la estructura de salida
La salida normalmente incluye:
-
standard-output.json
: Contiene los resultados de extracción estándar -
custom-output.json
: Contiene los resultados de planos personalizados -
metadata.json
: Contiene metadatos de procesamiento y puntuaciones de confianza
Campos de respuesta comunes
La salida estándar normalmente incluye:
-
extractedData
: La principal información extraída -
confidence
: Puntuaciones de confianza para cada campo extraído -
metadata
: Procesamiento de información, incluidas las marcas de tiempo y los detalles del modelo -
boundingBoxes
: información de ubicación de los elementos detectados (si está activado)
Gestión de errores y solución de problemas
Escenarios y soluciones de error comunes:
-
URI de S3 no válido: asegúrese de que su bucket de S3 existe y de que tiene los permisos adecuados
-
Falta data-automation-profile-arn: este parámetro es obligatorio para todas las solicitudes de procesamiento
-
Proyecto no encontrado: compruebe que el ARN del proyecto es correcto y que el proyecto existe
-
Formato de archivo no compatible: compruebe que el formato de archivo sea compatible con BDA
Añadir etiquetas a los trabajos de procesamiento
Puede añadir etiquetas para ayudar a organizar y realizar un seguimiento de sus trabajos de procesamiento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"