Pemrosesan dokumen - Amazon Comprehend

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pemrosesan dokumen

Amazon Comprehend mendukung pemrosesan dokumen satu langkah untuk klasifikasi kustom dan pengenalan entitas kustom. Misalnya, Anda dapat memasukkan campuran dokumen teks biasa dan dokumen semi-terstruktur (seperti dokumen PDF, dokumen Microsoft Word, dan gambar) ke pekerjaan analisis kustom.

Untuk file input yang memerlukan ekstraksi teks, Amazon Comprehend secara otomatis melakukan ekstraksi teks sebelum menjalankan analisis. Untuk mengekstrak konten teks, Amazon Comprehend menggunakan parser internal untuk dokumen semi-terstruktur asli dan menggunakan Amazon Textract API untuk gambar dan dokumen yang dipindai.

Pemrosesan dokumen Amazon Comprehend tersedia di masing-masing Amazon ComprehendWilayah yang Didukung, kecuali Asia Pasifik (Tokyo AWS GovCloud ) dan (AS-Barat) hanya mendukung model teks biasa untuk klasifikasi khusus.

Topik berikut memberikan detail tentang jenis dokumen masukan yang didukung Amazon Comprehend untuk analisis kustom.