Procesamiento mediante CLI - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Procesamiento mediante CLI

Procese su primer documento a través de CLI

Introduzca los archivos en un bucket de S3

Antes de procesar documentos con BDA, primero debe cargarlos en un depósito de S3:

Sintaxis

aws s3 cp <source> <target> [--options]

Ejemplo:

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Estructura básica de comandos de procesamiento

Utilice el invoke-data-automation-async comando para procesar archivos:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Estructura de comandos de procesamiento avanzada

Procesamiento de vídeo con segmentos de tiempo

En el caso de los archivos de vídeo, puede especificar los segmentos de tiempo que se van a procesar:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Uso de planos personalizados

Puede especificar planos personalizados directamente en el comando:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Añadir una configuración de cifrado

Para mejorar la seguridad, puede añadir una configuración de cifrado:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Notificaciones de eventos

Habilite EventBridge las notificaciones para completar el procesamiento:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Comprobar el estado del procesamiento

Utilice el get-data-automation-status comando para comprobar el estado de su trabajo de procesamiento:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

La respuesta incluirá el estado actual:

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Recupere los resultados del procesamiento

Localizar los archivos de salida en S3

Enumere los archivos de salida de su bucket de S3:

aws s3 ls s3://amzn-s3-demo-bucket/output/

Descargue los resultados en su máquina local:

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Comprensión de la estructura de salida

La salida normalmente incluye:

  • standard-output.json: Contiene los resultados de extracción estándar

  • custom-output.json: Contiene los resultados de planos personalizados

  • metadata.json: Contiene metadatos de procesamiento y puntuaciones de confianza

Campos de respuesta comunes

La salida estándar normalmente incluye:

  • extractedData: La principal información extraída

  • confidence: Puntuaciones de confianza para cada campo extraído

  • metadata: Procesamiento de información, incluidas las marcas de tiempo y los detalles del modelo

  • boundingBoxes: información de ubicación de los elementos detectados (si está activado)

Gestión de errores y solución de problemas

Escenarios y soluciones de error comunes:

  • URI de S3 no válido: asegúrese de que su bucket de S3 existe y de que tiene los permisos adecuados

  • Falta data-automation-profile-arn: este parámetro es obligatorio para todas las solicitudes de procesamiento

  • Proyecto no encontrado: compruebe que el ARN del proyecto es correcto y que el proyecto existe

  • Formato de archivo no compatible: compruebe que el formato de archivo sea compatible con BDA

Añadir etiquetas a los trabajos de procesamiento

Puede añadir etiquetas para ayudar a organizar y realizar un seguimiento de sus trabajos de procesamiento:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"