Utilizzo della CLI di automazione Amazon Bedrock dei dati - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo della CLI di automazione Amazon Bedrock dei dati

La funzionalità Amazon Bedrock Data Automation (BDA) fornisce un flusso di lavoro CLI semplificato per l'elaborazione dei dati. Per tutte le modalità, questo flusso di lavoro consiste in tre fasi principali: creazione di un progetto, creazione di blueprint per output personalizzati ed elaborazione di documenti. Questa guida illustra i principali comandi CLI per l'utilizzo di BDA.

Crea il tuo primo progetto di Data Automation

Per iniziare a lavorare con BDA, crea prima un progetto utilizzando il create-data-automation-project comando.

Considera questo esempio di passaporto che elaboreremo:

Quando crei un progetto, devi definire le impostazioni di configurazione per il tipo di file che intendi elaborare. Il comando seguente rappresenta un esempio di lavoro minimo per la creazione di un progetto di elaborazione delle immagini:

aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'

Il comando convalida la configurazione di input e crea un nuovo progetto con un ARN univoco. Una risposta includerebbe l'ARN e lo stage del progetto:

{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }

Se un progetto viene creato senza parametri, verranno applicate le impostazioni predefinite. Ad esempio, durante l'elaborazione delle immagini, il riepilogo delle immagini e il rilevamento del testo saranno abilitati per impostazione predefinita.

Riferimento completo ai parametri

La tabella seguente mostra tutti i parametri disponibili per il create-data-automation-project comando:

Parametri per create-data-automation-project
Parametro Obbligatorio Predefinito Descrizione
--project-name N/D Nome del progetto Data Automation
--project-stage No DAL VIVO Fase per il progetto (DEVELOPMENT o LIVE)
--standard-output-configuration N/D Configurazione JSON per l'elaborazione standard dell'output
--custom-output-configuration No N/D Configurazione JSON per l'elaborazione personalizzata dell'output
--encryption-configuration No N/D Impostazioni di crittografia per il progetto
--client-token No Generato automaticamente Identificatore univoco per l'idempotenza della richiesta

Creazione di un blueprint

Dopo aver creato un progetto, puoi creare un Blueprint per definire la struttura dell'elaborazione dei dati utilizzando il create-blueprint comando.

Ecco un esempio di lavoro minimo per creare un Blueprint personalizzato per l'elaborazione dei passaporti:

aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'

Il comando crea un nuovo Blueprint con lo schema specificato. È quindi possibile utilizzare questo Blueprint durante l'elaborazione di documenti per estrarre dati strutturati in base allo schema definito.

Usando il tuo Blueprint

Aggiungere un Blueprint a un progetto

Per aggiungere un Blueprint al tuo progetto, usa il update-data-automation-project comando:

aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'

Verifica dell'integrazione con Blueprint

È possibile verificare l'integrazione di Blueprint utilizzando il comando: get-data-automation-project

aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"

Gestione di più Blueprint

Usa il list-blueprints comando per visualizzare tutti i tuoi progetti:

aws bedrock-data-automation list-blueprints

Elabora documenti

Una volta impostato un progetto, puoi elaborare i documenti usando il invoke-data-automation-async comando:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Il comando restituisce un ARN di chiamata che puoi usare per controllare lo stato di elaborazione:

{ "invocationArn": "Amazon Resource Name (ARN)" }

Controlla lo stato di elaborazione

Per verificare lo stato del processo di elaborazione, utilizzate il get-data-automation-status comando:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

Il comando restituisce lo stato corrente del processo di elaborazione:

{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }

I valori di stato possibili includono:

  • IN_PROGRESS: Il processo di elaborazione è attualmente in esecuzione.

  • COMPLETED: Il processo di elaborazione è stato completato con successo.

  • FAILED: il processo di elaborazione non è riuscito. Controlla la risposta per i dettagli dell'errore.

  • STOPPED: il processo di elaborazione è stato interrotto manualmente.

Recupera risultati

Una volta completata l'elaborazione, puoi elencare i file di output nel tuo bucket S3:

aws s3 ls s3://my-bda-documents/output/efgh5678/

Per scaricare i risultati sul computer locale:

aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

L'output include dati strutturati basati sulla configurazione del progetto e su qualsiasi Blueprint applicato.