Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Procesamiento mediante la CLI
Procesamiento de su primer documento a través de la CLI
Introducción de archivos en un bucket de S3
Antes de procesar documentos con BDA, primero debe cargar los documentos en un bucket de S3:
Sintaxis
aws s3 cp <source> <target> [--options]
Ejemplo:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Estructura del comando básico de procesamiento
Utilice el comando invoke-data-automation-async para procesar archivos:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Estructura del comando avanzado de procesamiento
Procesamiento de vídeo con segmentos de tiempo
Para los archivos de vídeo, puede especificar los segmentos de tiempo que se van a procesar:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Uso de esquemas personalizados
Puede especificar esquemas personalizados directamente en el comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Adición de configuración de cifrado
Para mejorar la seguridad, puede añadir una configuración de cifrado:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Notificaciones de eventos
Active las notificaciones de EventBridge para completar el procesamiento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Comprobación del estado de procesamiento
Para comprobar el estado del trabajo de procesamiento, utilice el comando get-data-automation-status:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
La respuesta incluirá el estado actual:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Recuperación de los resultados de procesamiento
Localización de los archivos de salida en S3
Muestre los archivos de salida en su bucket de S3:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Descargue los resultados en el equipo local:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Descripción de la estructura de salida
La salida suele incluir lo siguiente:
-
standard-output.json: contiene los resultados de extracción estándar -
custom-output.json: contiene los resultados de esquemas personalizados -
metadata.json: contiene los metadatos de procesamiento y las puntuaciones de confianza
Campos de respuesta comunes
La salida estándar suele incluir lo siguiente:
-
extractedData: la información principal extraída -
confidence: puntuaciones de confianza para cada campo extraído -
metadata: información de procesamiento, incluidas las marcas de tiempo y los detalles del modelo -
boundingBoxes: información de ubicación de los elementos detectados (si se ha activado)
Gestión de errores y solución de problemas
Escenarios y soluciones de error comunes:
-
Invalid S3 URI: asegúrese de que su bucket de S3 existe y de que tiene los permisos adecuados
-
Missing data-automation-profile-arn: este parámetro es obligatorio para todas las solicitudes de procesamiento
-
Project not found: compruebe que el ARN de su proyecto sea correcto y que el proyecto exista
-
Unsupported file format: compruebe que el formato de archivo sea compatible con BDA
Adición de etiquetas a trabajos de procesamiento
Puede añadir etiquetas para facilitar la organización y el seguimiento de los trabajos de procesamiento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"