Pemrosesan melalui CLI - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pemrosesan melalui CLI

Proses dokumen pertama Anda melalui CLI

Masukkan file ke dalam ember S3

Sebelum memproses dokumen dengan BDA, Anda harus terlebih dahulu mengunggah dokumen Anda ke bucket S3:

Sintaksis

aws s3 cp <source> <target> [--options]

Contoh:

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Struktur perintah pemrosesan dasar

Gunakan invoke-data-automation-async perintah untuk memproses file:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Struktur perintah pemrosesan lanjutan

Pemrosesan video dengan segmen waktu

Untuk file video, Anda dapat menentukan segmen waktu untuk diproses:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Menggunakan cetak biru khusus

Anda dapat menentukan cetak biru khusus secara langsung di perintah:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Menambahkan konfigurasi enkripsi

Untuk keamanan yang ditingkatkan, Anda dapat menambahkan konfigurasi enkripsi:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Pemberitahuan acara

Aktifkan EventBridge pemberitahuan untuk penyelesaian pemrosesan:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Memeriksa status pemrosesan

Gunakan get-data-automation-status perintah untuk memeriksa status pekerjaan pemrosesan Anda:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

Tanggapan akan mencakup status saat ini:

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Ambil hasil pemrosesan

Menemukan file output di S3

Buat daftar file output di bucket S3 Anda:

aws s3 ls s3://amzn-s3-demo-bucket/output/

Unduh hasilnya ke mesin lokal Anda:

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Memahami struktur keluaran

Output biasanya meliputi:

  • standard-output.json: Berisi hasil ekstraksi standar

  • custom-output.json: Berisi hasil dari cetak biru kustom

  • metadata.json: Berisi metadata pemrosesan dan skor kepercayaan

Bidang respons umum

Output standar biasanya meliputi:

  • extractedData: Informasi utama yang diekstraksi

  • confidence: Skor kepercayaan untuk setiap bidang yang diekstraksi

  • metadata: Memproses informasi termasuk stempel waktu dan detail model

  • boundingBoxes: Informasi lokasi untuk elemen yang terdeteksi (jika diaktifkan)

Penanganan kesalahan dan pemecahan masalah

Skenario dan solusi kesalahan umum:

  • URI S3 tidak valid: Pastikan bucket S3 Anda ada dan Anda memiliki izin yang tepat

  • Hilang data-automation-profile-arn: Parameter ini diperlukan untuk semua permintaan pemrosesan

  • Proyek tidak ditemukan: Verifikasi ARN proyek Anda benar dan proyek ada

  • Format file yang tidak didukung: Periksa apakah format file Anda didukung oleh BDA

Menambahkan tag untuk memproses pekerjaan

Anda dapat menambahkan tag untuk membantu mengatur dan melacak pekerjaan pemrosesan Anda:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"