Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Tahap analisis
Dengan memproses file PDF, Anda mengekstrak konten yang dapat digunakan untuk pemrosesan dan analisis lebih lanjut. Misalnya, Anda dapat mengidentifikasi tren biaya dengan menggunakan bidang biaya laporan operasi harian atau menghasilkan wawasan dengan menggabungkan indikator kinerja utama (KPI) untuk operasi bisnis. Anda juga dapat menggabungkan konten yang diekstraksi dengan sumber data lain, termasuk data lake, gudang data, data pihak ketiga, atau data manajemen hubungan pelanggan (CRM) untuk melakukan analisis bisnis yang mendalam.
Amazon QuickSight adalah layanan intelijen bisnis tanpa server yang terhubung ke bucket Amazon Simple Storage Service (Amazon S3) yang berisi data file PDF Anda. Analis bisnis Anda kemudian dapat membuat dasbor untuk menganalisis, memvisualisasikan, dan langsung menghasilkan wawasan dari file JSON di bucket S3. Dasbor terhubung ke bucket S3 dan diperbarui secara otomatis setelah file PDF baru diproses. Anda juga dapat berbagi dasbor dengan pengguna yang berbeda dan pengguna juga dapat berlangganan dasbor untuk melihatnya di perangkat seluler. Untuk informasi selengkapnya tentang hal ini, lihat Membuat kumpulan data menggunakan file Amazon S3 dalam QuickSight dokumentasi Amazon.
Sebagian besar file PDF juga berisi konten teks kaya di dalam formulir dan tabel atau dalam paragraf teks gratis. Setelah konten teks diekstraksi, konten teks kaya dapat digunakan oleh layanan kecerdasanAWS buatan dan pembelajaran mesin (AI/HTML) lainnya yang dapat menangani pemrosesan bahasa alami (NLP), seperti Amazon Comprehend atau Amazon Translate. Anda juga dapat menggunakan Amazon Kendra untuk mengindeks dan mencari dokumen yang diambil dari database besar file PDF.
Ilmuwan data dan teknisi MLAnda juga dapat menggunakan Amazon SageMaker untuk mengakses data yang diekstraksi secara langsung di bucket S3 atau tabel Amazon DynamoDB dan kemudian menerapkan pemodelan dan prediksi ML-lanjutan.
Praktik terbaik untuk tahap analisis
Anda dapat menggunakan dua praktik terbaik berikut untuk memastikan fase analitik yang berhasil:
-
Buat file manifes untuk menggunakan bucket S3 sebagai sumber data untuk Amazon QuickSight. Untuk informasi selengkapnya tentang ini, lihat Membuat analisis menggunakan data Amazon S3 Anda sendiri di QuickSight dokumentasi Amazon.
-
Perbarui set data Anda secara otomatis untuk menangkap data baru yang ditambahkan ke Amazon S3 dan menyegarkan dasbor Anda. Untuk informasi selengkapnya tentang ini, lihat Menyegarkan set data pada jadwal di QuickSight dokumentasi Amazon.