Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Elaborazione tramite CLI
Elaborare il tuo primo documento tramite CLI
Inserire i file in un bucket S3
Prima di elaborare i documenti con BDA, è necessario caricarli in un bucket S3:
Sintassi
aws s3 cp <source> <target> [--options]
Esempio:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Struttura dei comandi di elaborazione di base
Utilizzare il comando invoke-data-automation-async per elaborare i file:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Struttura avanzata dei comandi di elaborazione
Elaborazione video con segmenti di tempo
Per i file video, è possibile specificare i segmenti di tempo da elaborare:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Utilizzo di blueprint personalizzati
È possibile specificare blueprint personalizzati direttamente nel comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Aggiunta della configurazione della crittografia
Per maggiore sicurezza, è possibile aggiungere una configurazione di crittografia:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Notifiche degli eventi
Abilitare le notifiche EventBridge per il completamento dell’elaborazione:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Verifica dello stato dell’elaborazione
Per verificare lo stato dell’elaborazione del processo, utilizzare il comando get-data-automation-status.
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
La risposta includerà lo stato attuale:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Recupera i risultati dell’elaborazione
Individuazione dei file di output in S3
Elencare i file di output nel bucket S3:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Scaricare i risultati nella macchina locale:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Comprendere la struttura di output
In genere l’output include:
-
standard-output.json: contiene risultati di estrazione standard -
custom-output.json: contiene risultati di blueprint personalizzati -
metadata.json: contiene i metadati di elaborazione e i punteggi di attendibilità
Campi di risposta comuni
In genere l’output standard include:
-
extractedData: le principali informazioni estratte -
confidence: punteggi di attendibilità per ogni campo estratto -
metadata: informazioni sull’elaborazione tra cui timestamp e dettagli del modello -
boundingBoxes: informazioni sulla posizione degli elementi rilevati (se abilitata)
Gestione e risoluzione degli errori
Scenari di errore comuni e soluzioni:
-
URI S3 non valido: assicurarsi che il bucket S3 esista e di disporre delle autorizzazioni appropriate
-
Data-automation-profile-arn mancante: questo parametro è obbligatorio per tutte le richieste di elaborazione
-
Progetto non trovato: verificare che l’ARN del progetto sia corretto e che il progetto esista
-
Formato di file non supportato: verificare che il formato di file sia supportato da BDA
Aggiunta di tag ai processi di elaborazione
È possibile aggiungere tag per organizzare e tenere traccia dei processi di elaborazione:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"