Citra - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Citra

Fitur Otomasi Amazon Bedrock Data (BDA) menawarkan serangkaian output standar yang komprehensif untuk pemrosesan gambar untuk menghasilkan wawasan dari gambar Anda. Anda dapat menggunakan wawasan ini untuk mengaktifkan berbagai aplikasi dan kasus penggunaan, seperti penemuan konten, penempatan iklan kontekstual, dan keamanan merek. Berikut adalah ikhtisar dari setiap jenis operasi yang tersedia sebagai bagian dari output standar untuk gambar:

Ringkasan Gambar

Ringkasan gambar menghasilkan keterangan deskriptif untuk sebuah gambar. Fitur ini diaktifkan dalam konfigurasi output standar secara default.

Taksonomi IAB

Klasifikasi Interactive Advertising Bureau (IAB) menerapkan taksonomi iklan standar untuk mengklasifikasikan konten gambar. Untuk Pratinjau, BDA akan mendukung 24 kategori tingkat atas (L1) dan 85 kategori tingkat kedua (L2). Untuk mengunduh daftar kategori IAB yang didukung oleh BDA, klik di sini.

Deteksi Logo

Fitur ini mengidentifikasi logo dalam gambar dan memberikan informasi kotak pembatas, menunjukkan koordinat setiap logo yang terdeteksi dalam gambar, dan skor kepercayaan. Fitur ini tidak diaktifkan secara default.

Deteksi Teks Gambar

Fitur ini mendeteksi dan mengekstrak teks yang muncul secara visual dalam gambar dan menyediakan informasi kotak pembatas, menunjukkan koordinat setiap elemen teks yang terdeteksi dalam gambar, dan skor kepercayaan. Fitur ini diaktifkan dalam konfigurasi output standar secara default.

Moderasi Konten

Moderasi konten mendeteksi konten yang tidak pantas, tidak diinginkan, atau menyinggung dalam gambar. Untuk Pratinjau, BDA akan mendukung 7 kategori moderasi: Eksplisit, Ketelanjangan Non-Eksplisit dari bagian Intim dan Ciuman, Pakaian Renang atau Pakaian Dalam, Kekerasan, Narkoba & Tembakau, Alkohol, simbol Kebencian. Teks eksplisit dalam gambar tidak ditandai.

Kotak pembatas dan skor kepercayaan terkait dapat diaktifkan atau dinonaktifkan untuk fitur yang relevan seperti deteksi teks untuk menyediakan koordinat lokasi dalam gambar. Secara default, ringkasan gambar dan deteksi teks gambar diaktifkan.

Output Standar Gambar

Berikut ini adalah contoh output standar untuk gambar yang diproses melalui BDA. Setiap bagian telah dipersingkat dan dipisahkan dengan penjelasan.

{ "metadata": { "id": "image_123", "semantic_modality": "IMAGE", "s3_bucket": "my-s3-bucket", "s3_prefix": "images/", "image_width_pixels": 1920, "image_height_pixels": 1080, "color_depth": 24, "image_encoding": "JPEG" },

Bagian pertama dari respons adalah metadat gambar. Ini memberi Anda nama file, jenis pengkodean, lokasi bucket s3 dan informasi lebih lanjut tentang konten.

"image": { "summary": "Lively party scene with decorations and supplies",

Pada awal respons adalah ringkasan generatif dari gambar.

"iab_categories": [ { "id": "iab_12345", "type": "IAB", "category": "Party Supplies", "confidence": 0.9, "parent_name": "Events & Attractions", "taxonomy_level": 2 }, { "id": "iab_67890", "type": "IAB", "category": "Decorations", "confidence": 0.8, "parent_name": "Events & Attractions", "taxonomy_level": 1 } ],

Selanjutnya, kita melihat katalog IAB melekat pada tanggapan. Ini mewakili berbagai jenis klasifikasi iklan, menggunakan taksonomi IAB standar. Masing-masing memiliki skor kepercayaan, taxonomy_level, dan parent_name untuk kategori tingkat tinggi umum.

"content_moderation": [ { "id": "mod_12345", "type": "MODERATION", "category": "Drugs & Tobacco Paraphernalia & Use", "confidence": 0.7, "parent_name": "Drugs & Tobacco", "taxonomy_level": 2 } ], ...

Moderasi konten berisi informasi tentang kemungkinan konten eksplisit dalam gambar. Masing-masing memiliki skor kepercayaan dan kategori, selaras dengan kategori moderasi konten yang dibahas sebelumnya di bagian ini.

"text_words": [ { "id": "word_1", "text": "lively", "confidence": 0.9, "line_id": "line_1", "locations": [ { "bounding_box": { "left": 100, "top": 200, "width": 50, "height": 20 }, "polygon": [ {"x": 100, "y": 200}, {"x": 150, "y": 200}, {"x": 150, "y": 220}, {"x": 100, "y": 220} ] } ] }, ...

Bagian ini memecah setiap kata yang terdeteksi dalam gambar, termasuk kepercayaan diri dan lokasi di layar dalam gambar. Ini juga menandai baris mana kata itu, menggunakanline_id.

"text_lines": [ { "id": "line_1", "text": "lively party", "confidence": 0.9, "locations": [ { "bounding_box": { "left": 100, "top": 200, "width": 200, "height": 20 }, "polygon": [ {"x": 100, "y": 200}, {"x": 300, "y": 200}, {"x": 300, "y": 220}, {"x": 100, "y": 220} ] } ] } ] },

Di sini, kata-kata terdeteksi dalam garis kolektif mereka, dengan skor kepercayaan diri dan kotak pembatas.

"statistics": { "entity_count": 7, "object_count": 3, "line_count": 2, "word_count": 9 } }

Akhirnya, kami memiliki statistik. Ini memecah semua konten dalam gambar, termasuk objek