Cree su primer proyecto de automatización de datos Referencia completa de parámetros Creación de un plano ¿Usando tu plano Procesa documentos Compruebe el estado del procesamiento Recuperar los resultados

Uso de la CLI de automatización de Amazon Bedrock datos

La función Amazon Bedrock de automatización de datos (BDA) proporciona un flujo de trabajo de CLI optimizado para procesar los datos. Para todas las modalidades, este flujo de trabajo consta de tres pasos principales: crear un proyecto, crear planos para obtener resultados personalizados y procesar documentos. Esta guía explica los comandos CLI clave para trabajar con BDA.

Cree su primer proyecto de automatización de datos

Para empezar a trabajar con BDA, cree primero un proyecto con el create-data-automation-project comando.

Considera este ejemplo de pasaporte que procesaremos:

Al crear un proyecto, debe definir los ajustes de configuración para el tipo de archivo que desea procesar. El siguiente comando representa un ejemplo práctico mínimo para crear un proyecto de procesamiento de imágenes:


aws bedrock-data-automation create-data-automation-project \
    --project-name "ImageProcessingProject" \
    --standard-output-configuration '{
        "image": {
            "extraction": {
                "category": {
                    "state": "ENABLED",
                    "types": ["TEXT_DETECTION"]
                },
                "boundingBox": {
                    "state": "ENABLED"
                }
            },
            "generativeField": {
                "state": "ENABLED"
            }
        }
    }'

El comando valida la configuración de entrada y crea un nuevo proyecto con un ARN único. Una respuesta incluiría el ARN del proyecto y la etapa:


{
    "projectArn": "Amazon Resource Name (ARN)",
    "projectStage": "DEVELOPMENT",
    "status": "IN_PROGRESS"
}

Si se crea un proyecto sin parámetros, se aplicará la configuración predeterminada. Por ejemplo, al procesar imágenes, el resumen de imágenes y la detección de texto estarán habilitadas de forma predeterminada.

Referencia completa de parámetros

En la siguiente tabla se muestran todos los parámetros disponibles para el create-data-automation-project comando:

Parámetros para create-data-automation-project
Parámetro	Obligatorio	Predeterminado/a	Descripción
`--project-name`	Sí	N/A	Nombre del proyecto de automatización de datos
`--project-stage`	No	ACTIVA	Etapa del proyecto (DESARROLLO o EN VIVO)
`--standard-output-configuration`	Sí	N/A	Configuración JSON para el procesamiento de salida estándar
`--custom-output-configuration`	No	N/A	Configuración JSON para el procesamiento de salida personalizado
`--encryption-configuration`	No	N/A	Configuración de cifrado del proyecto
`--client-token`	No	Generado automáticamente	Identificador único para la idempotencia de la solicitud

Creación de un plano

Tras crear un proyecto, puede crear un plano para definir la estructura del procesamiento de datos mediante el create-blueprint comando.

Este es un ejemplo práctico mínimo para crear un plan adaptado al procesamiento de pasaportes:


aws bedrock-data-automation create-blueprint \
    --blueprint-name "passport-blueprint" \
    --type "IMAGE" \
    --blueprint-stage "DEVELOPMENT" \
    --schema '{
        "class": "Passport",
        "description": "Blueprint for processing passport images",
        "properties": {
            "passport_number": {
                "type": "string",
                "inferenceType": "explicit",
                "instruction": "The passport identification number"
            },
            "full_name": {
                "type": "string",
                "inferenceType": "explicit",
                "instruction": "The full name of the passport holder"
            }
        }
    }'

El comando crea un nuevo plano con el esquema especificado. A continuación, puede utilizar este plano al procesar documentos para extraer datos estructurados de acuerdo con el esquema que haya definido.

¿Usando tu plano

Añadir un plano a un proyecto

Para añadir un plano a su proyecto, utilice el update-data-automation-project comando:


aws bedrock-data-automation update-data-automation-project \
    --project-arn "Amazon Resource Name (ARN)" \
    --standard-output-configuration '{
        "image": {
            "extraction": {
                "category": {
                    "state": "ENABLED",
                    "types": ["TEXT_DETECTION"]
                },
                "boundingBox": {
                    "state": "ENABLED"
                }
            },
            "generativeField": {
                "state": "ENABLED",
                "types": ["IMAGE_SUMMARY"]
            }
        }
    }' \
    --custom-output-configuration '{
        "blueprints": [
            {
                "blueprintArn": "Amazon Resource Name (ARN)",
                "blueprintVersion": "1",
                "blueprintStage": "LIVE"
            }
        ]
    }'

Verificación de la integración de Blueprint

Puede verificar la integración de Blueprint mediante el comando: get-data-automation-project


aws bedrock-data-automation get-data-automation-project \
    --project-arn "Amazon Resource Name (ARN)"

Administrar varios blueprints

Usa el list-blueprints comando para ver todos tus planos:


aws bedrock-data-automation list-blueprints

Procesa documentos

Una vez que haya configurado un proyecto, puede procesar los documentos mediante el invoke-data-automation-async comando:


aws bedrock-data-automation-runtime invoke-data-automation-async \
    --input-configuration '{
        "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf"
    }' \
    --output-configuration '{
        "s3Uri": "s3://my-bda-documents/output/"
    }' \
    --data-automation-configuration '{
        "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
        "stage": "LIVE"
    }' \
    --data-automation-profile-arn "Amazon Resource Name (ARN)"

El comando devuelve un ARN de invocación que puede utilizar para comprobar el estado del procesamiento:


{
    "invocationArn": "Amazon Resource Name (ARN)"
}

Compruebe el estado del procesamiento

Para comprobar el estado de su trabajo de procesamiento, utilice el get-data-automation-status comando:


aws bedrock-data-automation-runtime get-data-automation-status \
    --invocation-arn "Amazon Resource Name (ARN)"

El comando devuelve el estado actual del trabajo de procesamiento:


{
    "status": "COMPLETED",
    "creationTime": "2025-07-09T12:34:56.789Z",
    "lastModifiedTime": "2025-07-09T12:45:12.345Z",
    "outputLocation": "s3://my-bda-documents/output/efgh5678/"
}

Los valores de estado posibles incluyen:

IN_PROGRESS: El trabajo de procesamiento se está ejecutando actualmente.
COMPLETED: El trabajo de procesamiento se ha completado correctamente.
FAILED: El trabajo de procesamiento ha fallado. Compruebe la respuesta para ver los detalles del error.
STOPPED: El trabajo de procesamiento se detuvo manualmente.

Recuperar los resultados

Una vez finalizado el procesamiento, puede enumerar los archivos de salida en su bucket de S3:


aws s3 ls s3://my-bda-documents/output/efgh5678/

Para descargar los resultados a su máquina local:


aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

El resultado incluye datos estructurados basados en la configuración del proyecto y en los planos que haya aplicado.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Requisitos previos para usar Bedrock Data Automation

Blueprint Operations CLI