Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Elaborazione tramite CLI
Elabora il tuo primo documento tramite CLI
Inserisci i file in un bucket S3
Prima di elaborare i documenti con BDA, devi prima caricare i documenti in un bucket S3:
Sintassi
aws s3 cp <source> <target> [--options]
Esempio:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Struttura dei comandi di elaborazione di base
Usa il invoke-data-automation-async
comando per elaborare i file:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Struttura avanzata dei comandi di elaborazione
Elaborazione video con segmenti di tempo
Per i file video, puoi specificare i segmenti di tempo da elaborare:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Utilizzo di progetti personalizzati
È possibile specificare progetti personalizzati direttamente nel comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Aggiungere la configurazione di crittografia
Per una maggiore sicurezza, puoi aggiungere una configurazione di crittografia:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Notifiche eventi
Abilita EventBridge le notifiche per il completamento dell'elaborazione:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Verifica dello stato dell'elaborazione
Utilizzate il get-data-automation-status
comando per verificare lo stato del processo di elaborazione:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
La risposta includerà lo stato attuale:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Recupera i risultati dell'elaborazione
Individuazione dei file di output in S3
Elenca i file di output nel tuo bucket S3:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Scarica i risultati sul tuo computer locale:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Comprensione della struttura di output
L'output include in genere:
-
standard-output.json
: contiene risultati di estrazione standard -
custom-output.json
: contiene i risultati di progetti personalizzati -
metadata.json
: Contiene i metadati di elaborazione e i punteggi di confidenza
Campi di risposta comuni
L'output standard include in genere:
-
extractedData
: Le principali informazioni estratte -
confidence
: punteggi di confidenza per ogni campo estratto -
metadata
: Elaborazione delle informazioni, compresi i timestamp e i dettagli del modello -
boundingBoxes
: informazioni sulla posizione degli elementi rilevati (se abilitati)
Gestione e risoluzione degli errori
Scenari e soluzioni di errore comuni:
-
URI S3 non valido: assicurati che il bucket S3 esista e di disporre delle autorizzazioni appropriate
-
Mancante data-automation-profile-arn: questo parametro è obbligatorio per tutte le richieste di elaborazione
-
Progetto non trovato: verifica che l'ARN del progetto sia corretto e che il progetto esista
-
Formato di file non supportato: verifica che il formato di file sia supportato da BDA
Aggiungere tag ai processi di elaborazione
Puoi aggiungere tag per organizzare e tenere traccia dei processi di elaborazione:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"