Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo della CLI di automazione Amazon Bedrock dei dati
La funzionalità Amazon Bedrock Data Automation (BDA) fornisce un flusso di lavoro CLI semplificato per l'elaborazione dei dati. Per tutte le modalità, questo flusso di lavoro consiste in tre fasi principali: creazione di un progetto, creazione di blueprint per output personalizzati ed elaborazione di documenti. Questa guida illustra i principali comandi CLI per l'utilizzo di BDA.
Crea il tuo primo progetto di Data Automation
Per iniziare a lavorare con BDA, crea prima un progetto utilizzando il create-data-automation-project
comando.
Considera questo esempio di passaporto che elaboreremo:

Quando crei un progetto, devi definire le impostazioni di configurazione per il tipo di file che intendi elaborare. Il comando seguente rappresenta un esempio di lavoro minimo per la creazione di un progetto di elaborazione delle immagini:
aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'
Il comando convalida la configurazione di input e crea un nuovo progetto con un ARN univoco. Una risposta includerebbe l'ARN e lo stage del progetto:
{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }
Se un progetto viene creato senza parametri, verranno applicate le impostazioni predefinite. Ad esempio, durante l'elaborazione delle immagini, il riepilogo delle immagini e il rilevamento del testo saranno abilitati per impostazione predefinita.
Riferimento completo ai parametri
La tabella seguente mostra tutti i parametri disponibili per il create-data-automation-project
comando:
Parametro | Obbligatorio | Predefinito | Descrizione |
---|---|---|---|
--project-name |
Sì | N/D | Nome del progetto Data Automation |
--project-stage |
No | DAL VIVO | Fase per il progetto (DEVELOPMENT o LIVE) |
--standard-output-configuration |
Sì | N/D | Configurazione JSON per l'elaborazione standard dell'output |
--custom-output-configuration |
No | N/D | Configurazione JSON per l'elaborazione personalizzata dell'output |
--encryption-configuration |
No | N/D | Impostazioni di crittografia per il progetto |
--client-token |
No | Generato automaticamente | Identificatore univoco per l'idempotenza della richiesta |
Creazione di un blueprint
Dopo aver creato un progetto, puoi creare un Blueprint per definire la struttura dell'elaborazione dei dati utilizzando il create-blueprint
comando.
Ecco un esempio di lavoro minimo per creare un Blueprint personalizzato per l'elaborazione dei passaporti:
aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'
Il comando crea un nuovo Blueprint con lo schema specificato. È quindi possibile utilizzare questo Blueprint durante l'elaborazione di documenti per estrarre dati strutturati in base allo schema definito.
Usando il tuo Blueprint
Aggiungere un Blueprint a un progetto
Per aggiungere un Blueprint al tuo progetto, usa il update-data-automation-project
comando:
aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'
Verifica dell'integrazione con Blueprint
È possibile verificare l'integrazione di Blueprint utilizzando il comando: get-data-automation-project
aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"
Gestione di più Blueprint
Usa il list-blueprints
comando per visualizzare tutti i tuoi progetti:
aws bedrock-data-automation list-blueprints
Elabora documenti
Una volta impostato un progetto, puoi elaborare i documenti usando il invoke-data-automation-async
comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Il comando restituisce un ARN di chiamata che puoi usare per controllare lo stato di elaborazione:
{ "invocationArn": "Amazon Resource Name (ARN)" }
Controlla lo stato di elaborazione
Per verificare lo stato del processo di elaborazione, utilizzate il get-data-automation-status
comando:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
Il comando restituisce lo stato corrente del processo di elaborazione:
{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }
I valori di stato possibili includono:
-
IN_PROGRESS
: Il processo di elaborazione è attualmente in esecuzione. -
COMPLETED
: Il processo di elaborazione è stato completato con successo. -
FAILED
: il processo di elaborazione non è riuscito. Controlla la risposta per i dettagli dell'errore. -
STOPPED
: il processo di elaborazione è stato interrotto manualmente.
Recupera risultati
Una volta completata l'elaborazione, puoi elencare i file di output nel tuo bucket S3:
aws s3 ls s3://my-bda-documents/output/efgh5678/
Per scaricare i risultati sul computer locale:
aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive
L'output include dati strutturati basati sulla configurazione del progetto e su qualsiasi Blueprint applicato.