Verarbeitung über CLI - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verarbeitung über CLI

Verarbeiten Sie Ihr erstes Dokument über CLI

Geben Sie Dateien in einen S3-Bucket ein

Bevor Sie Dokumente mit BDA verarbeiten, müssen Sie Ihre Dokumente zunächst in einen S3-Bucket hochladen:

Syntax

aws s3 cp <source> <target> [--options]

Beispiel:

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Grundlegende Struktur der Verarbeitungsbefehle

Verwenden Sie den invoke-data-automation-async Befehl, um Dateien zu verarbeiten:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Befehlsstruktur für die erweiterte Verarbeitung

Videoverarbeitung mit Zeitsegmenten

Für Videodateien können Sie Zeitsegmente angeben, die verarbeitet werden sollen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Verwenden von benutzerdefinierten Blueprints

Sie können benutzerdefinierte Blueprints direkt im Befehl angeben:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Verschlüsselungskonfiguration wird hinzugefügt

Für mehr Sicherheit können Sie eine Verschlüsselungskonfiguration hinzufügen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Ereignis-Benachrichtigungen

EventBridge Benachrichtigungen für den Abschluss der Verarbeitung aktivieren:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Der Verarbeitungsstatus wird überprüft

Verwenden Sie den get-data-automation-status Befehl, um den Status Ihres Verarbeitungsjobs zu überprüfen:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

Die Antwort wird den aktuellen Status enthalten:

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Verarbeitungsergebnisse abrufen

Suchen nach Ausgabedateien in S3

Listet die Ausgabedateien in Ihrem S3-Bucket auf:

aws s3 ls s3://amzn-s3-demo-bucket/output/

Laden Sie die Ergebnisse auf Ihren lokalen Computer herunter:

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Die Output-Struktur verstehen

Die Ausgabe umfasst in der Regel:

  • standard-output.json: Enthält Standardextraktionsergebnisse

  • custom-output.json: Enthält Ergebnisse aus benutzerdefinierten Blueprints

  • metadata.json: Enthält Verarbeitungsmetadaten und Konfidenzwerte

Allgemeine Antwortfelder

Die Standardausgabe umfasst in der Regel:

  • extractedData: Die wichtigsten extrahierten Informationen

  • confidence: Konfidenzwerte für jedes extrahierte Feld

  • metadata: Verarbeitung von Informationen wie Zeitstempeln und Modelldetails

  • boundingBoxes: Standortinformationen für erkannte Elemente (falls aktiviert)

Fehlerbehandlung und Problembehandlung

Häufige Fehlerszenarien und Lösungen:

  • Ungültiger S3-URI: Stellen Sie sicher, dass Ihr S3-Bucket existiert und Sie über die entsprechenden Berechtigungen verfügen

  • Fehlt data-automation-profile-arn: Dieser Parameter ist für alle Verarbeitungsanfragen erforderlich

  • Projekt nicht gefunden: Stellen Sie sicher, dass Ihr Projekt-ARN korrekt ist und das Projekt existiert

  • Nicht unterstütztes Dateiformat: Stellen Sie sicher, dass Ihr Dateiformat von BDA unterstützt wird

Hinzufügen von Tags zu Verarbeitungsaufträgen

Sie können Tags hinzufügen, um Ihre Verarbeitungsaufträge zu organisieren und nachzuverfolgen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"