Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verarbeitung über CLI
Verarbeiten Sie Ihr erstes Dokument über CLI
Geben Sie Dateien in einen S3-Bucket ein
Bevor Sie Dokumente mit BDA verarbeiten, müssen Sie Ihre Dokumente zunächst in einen S3-Bucket hochladen:
Syntax
aws s3 cp <source> <target> [--options]
Beispiel:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Grundlegende Struktur der Verarbeitungsbefehle
Verwenden Sie den invoke-data-automation-async
Befehl, um Dateien zu verarbeiten:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Befehlsstruktur für die erweiterte Verarbeitung
Videoverarbeitung mit Zeitsegmenten
Für Videodateien können Sie Zeitsegmente angeben, die verarbeitet werden sollen:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Verwenden von benutzerdefinierten Blueprints
Sie können benutzerdefinierte Blueprints direkt im Befehl angeben:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Verschlüsselungskonfiguration wird hinzugefügt
Für mehr Sicherheit können Sie eine Verschlüsselungskonfiguration hinzufügen:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Ereignis-Benachrichtigungen
EventBridge Benachrichtigungen für den Abschluss der Verarbeitung aktivieren:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Der Verarbeitungsstatus wird überprüft
Verwenden Sie den get-data-automation-status
Befehl, um den Status Ihres Verarbeitungsjobs zu überprüfen:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
Die Antwort wird den aktuellen Status enthalten:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Verarbeitungsergebnisse abrufen
Suchen nach Ausgabedateien in S3
Listet die Ausgabedateien in Ihrem S3-Bucket auf:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Laden Sie die Ergebnisse auf Ihren lokalen Computer herunter:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Die Output-Struktur verstehen
Die Ausgabe umfasst in der Regel:
-
standard-output.json
: Enthält Standardextraktionsergebnisse -
custom-output.json
: Enthält Ergebnisse aus benutzerdefinierten Blueprints -
metadata.json
: Enthält Verarbeitungsmetadaten und Konfidenzwerte
Allgemeine Antwortfelder
Die Standardausgabe umfasst in der Regel:
-
extractedData
: Die wichtigsten extrahierten Informationen -
confidence
: Konfidenzwerte für jedes extrahierte Feld -
metadata
: Verarbeitung von Informationen wie Zeitstempeln und Modelldetails -
boundingBoxes
: Standortinformationen für erkannte Elemente (falls aktiviert)
Fehlerbehandlung und Problembehandlung
Häufige Fehlerszenarien und Lösungen:
-
Ungültiger S3-URI: Stellen Sie sicher, dass Ihr S3-Bucket existiert und Sie über die entsprechenden Berechtigungen verfügen
-
Fehlt data-automation-profile-arn: Dieser Parameter ist für alle Verarbeitungsanfragen erforderlich
-
Projekt nicht gefunden: Stellen Sie sicher, dass Ihr Projekt-ARN korrekt ist und das Projekt existiert
-
Nicht unterstütztes Dateiformat: Stellen Sie sicher, dass Ihr Dateiformat von BDA unterstützt wird
Hinzufügen von Tags zu Verarbeitungsaufträgen
Sie können Tags hinzufügen, um Ihre Verarbeitungsaufträge zu organisieren und nachzuverfolgen:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"