Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pemrosesan melalui CLI
Proses dokumen pertama Anda melalui CLI
Masukkan file ke dalam ember S3
Sebelum memproses dokumen dengan BDA, Anda harus terlebih dahulu mengunggah dokumen Anda ke bucket S3:
Sintaksis
aws s3 cp <source> <target> [--options]
Contoh:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Struktur perintah pemrosesan dasar
Gunakan invoke-data-automation-async
perintah untuk memproses file:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Struktur perintah pemrosesan lanjutan
Pemrosesan video dengan segmen waktu
Untuk file video, Anda dapat menentukan segmen waktu untuk diproses:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Menggunakan cetak biru khusus
Anda dapat menentukan cetak biru khusus secara langsung di perintah:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Menambahkan konfigurasi enkripsi
Untuk keamanan yang ditingkatkan, Anda dapat menambahkan konfigurasi enkripsi:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Pemberitahuan acara
Aktifkan EventBridge pemberitahuan untuk penyelesaian pemrosesan:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Memeriksa status pemrosesan
Gunakan get-data-automation-status
perintah untuk memeriksa status pekerjaan pemrosesan Anda:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
Tanggapan akan mencakup status saat ini:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Ambil hasil pemrosesan
Menemukan file output di S3
Buat daftar file output di bucket S3 Anda:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Unduh hasilnya ke mesin lokal Anda:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Memahami struktur keluaran
Output biasanya meliputi:
-
standard-output.json
: Berisi hasil ekstraksi standar -
custom-output.json
: Berisi hasil dari cetak biru kustom -
metadata.json
: Berisi metadata pemrosesan dan skor kepercayaan
Bidang respons umum
Output standar biasanya meliputi:
-
extractedData
: Informasi utama yang diekstraksi -
confidence
: Skor kepercayaan untuk setiap bidang yang diekstraksi -
metadata
: Memproses informasi termasuk stempel waktu dan detail model -
boundingBoxes
: Informasi lokasi untuk elemen yang terdeteksi (jika diaktifkan)
Penanganan kesalahan dan pemecahan masalah
Skenario dan solusi kesalahan umum:
-
URI S3 tidak valid: Pastikan bucket S3 Anda ada dan Anda memiliki izin yang tepat
-
Hilang data-automation-profile-arn: Parameter ini diperlukan untuk semua permintaan pemrosesan
-
Proyek tidak ditemukan: Verifikasi ARN proyek Anda benar dan proyek ada
-
Format file yang tidak didukung: Periksa apakah format file Anda didukung oleh BDA
Menambahkan tag untuk memproses pekerjaan
Anda dapat menambahkan tag untuk membantu mengatur dan melacak pekerjaan pemrosesan Anda:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"