Procesamiento mediante la CLI - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Procesamiento mediante la CLI

Procesamiento de su primer documento a través de la CLI

Introducción de archivos en un bucket de S3

Antes de procesar documentos con BDA, primero debe cargar los documentos en un bucket de S3:

Sintaxis

aws s3 cp <source> <target> [--options]

Ejemplo:

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Estructura del comando básico de procesamiento

Utilice el comando invoke-data-automation-async para procesar archivos:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Estructura del comando avanzado de procesamiento

Procesamiento de vídeo con segmentos de tiempo

Para los archivos de vídeo, puede especificar los segmentos de tiempo que se van a procesar:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Uso de esquemas personalizados

Puede especificar esquemas personalizados directamente en el comando:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Adición de configuración de cifrado

Para mejorar la seguridad, puede añadir una configuración de cifrado:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Notificaciones de eventos

Active las notificaciones de EventBridge para completar el procesamiento:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Comprobación del estado de procesamiento

Para comprobar el estado del trabajo de procesamiento, utilice el comando get-data-automation-status:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

La respuesta incluirá el estado actual:

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Recuperación de los resultados de procesamiento

Localización de los archivos de salida en S3

Muestre los archivos de salida en su bucket de S3:

aws s3 ls s3://amzn-s3-demo-bucket/output/

Descargue los resultados en el equipo local:

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Descripción de la estructura de salida

La salida suele incluir lo siguiente:

  • standard-output.json: contiene los resultados de extracción estándar

  • custom-output.json: contiene los resultados de esquemas personalizados

  • metadata.json: contiene los metadatos de procesamiento y las puntuaciones de confianza

Campos de respuesta comunes

La salida estándar suele incluir lo siguiente:

  • extractedData: la información principal extraída

  • confidence: puntuaciones de confianza para cada campo extraído

  • metadata: información de procesamiento, incluidas las marcas de tiempo y los detalles del modelo

  • boundingBoxes: información de ubicación de los elementos detectados (si se ha activado)

Gestión de errores y solución de problemas

Escenarios y soluciones de error comunes:

  • Invalid S3 URI: asegúrese de que su bucket de S3 existe y de que tiene los permisos adecuados

  • Missing data-automation-profile-arn: este parámetro es obligatorio para todas las solicitudes de procesamiento

  • Project not found: compruebe que el ARN de su proyecto sea correcto y que el proyecto exista

  • Unsupported file format: compruebe que el formato de archivo sea compatible con BDA

Adición de etiquetas a trabajos de procesamiento

Puede añadir etiquetas para facilitar la organización y el seguimiento de los trabajos de procesamiento:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"