Mendeteksi teks - Amazon Rekognition

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mendeteksi teks

Amazon Rekognition dapat mendeteksi teks dalam citra dan video. Hal ini kemudian dapat mengonversi teks yang terdeteksi menjadi teks yang dapat dibaca oleh mesin. Anda dapat menggunakan deteksi teks yang dapat dibaca mesin dalam citra untuk menerapkan solusi seperti:

  • Pencarian visual. Misalnya, mengambil dan menampilkan citra yang berisi teks yang sama.

  • Wawasan konten. Misalnya, menyediakan wawasan tentang tema yang muncul dalam teks yang dikenali dalam bingkai video yang diekstraksi. Aplikasi Anda dapat mencari teks yang dikenali untuk konten yang relevan, seperti berita, skor olahraga, nomor atlet, dan keterangan.

  • Navigasi. Misalnya, mengembangkan aplikasi seluler berkemampuan bicara untuk penyandang disabilitas yang mengenali nama restoran, toko, atau rambu jalan.

  • Keamanan publik dan dukungan transportasi. Misalnya, mendeteksi nomor plat mobil dari citra kamera lalu lintas.

  • Memfilter. Misalnya, mem-filter informasi pengenal pribadi (PII) dari citra.

Untuk deteksi teks dalam video, Anda dapat menerapkan solusi seperti:

  • Mencari video untuk klip dengan kata kunci teks tertentu, seperti nama tamu pada grafik di acara berita.

  • Memoderasi konten untuk kepatuhan dengan standar organisasi dengan cara mendeteksi teks, kata tidak senonoh, atau spam yang tidak disengaja.

  • Menemukan semua lapisan teks pada lini masa video untuk pemrosesan lebih lanjut, seperti mengganti teks dengan teks dalam bahasa lain untuk internasionalisasi konten.

  • Menemukan lokasi teks, sehingga grafik lain dapat disejajarkan dengan tepat.

Untuk mendeteksi teks dalam gambar dalam format JPEG atau PNG, gunakan DetectTextoperasi. Untuk mendeteksi teks dalam video secara asinkron, gunakan dan operasi. StartTextDetectionGetTextDetection Operasi deteksi teks citra dan video mendukung sebagian besar font, termasuk font yang sangat bergaya. Setelah mendeteksi teks, Amazon Rekognition membuat representasi kata-kata dan baris teks yang terdeteksi, menunjukkan hubungan di antaranya, dan memberi tahu Anda tempat teks berada pada bingkai citra atau video.

Operasi DetectText dan GetTextDetection mendeteksi kata-kata dan baris. Sebuah kata adalah satu atau lebih karakter skrip yang tidak dipisahkan oleh spasi. DetectTextdapat mendeteksi hingga 100 kata dalam sebuah gambar. GetTextDetectionJuga dapat mendeteksi hingga 100 kata per frame video.

Kata adalah satu atau lebih karakter skrip yang tidak dipisahkan oleh spasi. Amazon Rekognition dirancang untuk mendeteksi kata-kata dalam bahasa Inggris, Arab, Rusia, Jerman, Prancis, Italia, Portugis, dan Spanyol.

Baris adalah rangkaian kata yang berjarak sama. Sebuah baris belum tentu merupakan kalimat yang lengkap (titik tidak menunjukkan akhir dari sebuah baris). Misalnya, Amazon Rekognition mendeteksi nomor lisensi pengemudi sebagai sebuah baris. Sebuah baris berakhir ketika tidak ada teks yang disejajarkan setelahnya atau ketika ada jarak yang besar di antara kata-kata, relatif terhadap panjang kata. Tergantung pada celah antar kata, Amazon Rekognition mungkin mendeteksi beberapa baris dalam teks yang disejajarkan dalam arah yang sama. Jika kalimat mencakup beberapa baris, maka operasi mengembalikan beberapa baris.

Pertimbangkan citra berikut.

Mug kopi dengan wajah tersenyum dan teks “Ini hari Senin tapi tetap tersenyum”, dengan kotak pembatas dan teks yang diekstraksi..

Kotak biru mewakili informasi tentang teks yang terdeteksi dan lokasi teks yang dikembalikan oleh operasi DetectText. Dalam contoh ini, Amazon Rekognition mendeteksi "IT'S", "SENIN", "tapi", "tetap", dan "Tersenyum" sebagai kata. Amazon Rekognition mendeteksi "IT'S", "SENIN", "tapi tetap", dan "Tersenyum" sebagai baris. Agar terdeteksi, teks harus berada dalam orientasi +/- 90 derajat dari sumbu horizontal.

Sebagai contoh, lihat Mendeteksi teks dalam sebuah citra.