Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Fase analisis
Dengan memproses file PDF, Anda mengekstrak konten yang dapat digunakan untuk pemrosesan dan analisis lebih lanjut. Misalnya, Anda dapat mengidentifikasi tren biaya dengan menggunakan bidang biaya laporan operasi harian atau menghasilkan wawasan dengan menggabungkan indikator kinerja utama (KPIs) untuk operasi bisnis. Anda juga dapat menggabungkan konten yang diekstraksi dengan sumber data lain, termasuk data lake, gudang data, data pihak ketiga, atau data manajemen hubungan pelanggan (CRM) untuk melakukan analisis bisnis yang mendalam.
Amazon QuickSight adalah layanan intelijen bisnis tanpa server yang terhubung ke bucket Amazon Simple Storage Service (Amazon S3) yang berisi data file PDF Anda yang diekstraksi. Analis bisnis Anda kemudian dapat membuat dasbor untuk menganalisis, memvisualisasikan, dan langsung menghasilkan wawasan dari file JSON di bucket S3. Dasbor terhubung ke bucket S3 dan diperbarui secara otomatis setelah file PDF baru diproses. Anda juga dapat berbagi dasbor dengan pengguna yang berbeda dan pengguna juga dapat berlangganan dasbor untuk melihatnya di perangkat seluler. Untuk informasi selengkapnya tentang ini, lihat Membuat kumpulan data menggunakan file Amazon S3 dalam dokumentasi Amazon QuickSight .
Sebagian besar file PDF juga berisi konten teks kaya di dalam formulir dan tabel atau dalam paragraf teks gratis. Setelah konten teks diekstraksi, konten teks kaya dapat digunakan oleh layanan kecerdasan AWS buatan dan pembelajaran mesin (AI/ML) lainnya yang dapat menangani pemrosesan bahasa alami (NLP), seperti Amazon Comprehend atau Amazon Translate. Anda juga dapat menggunakan Amazon Kendra untuk mengindeks dan mencari dokumen yang diekstrak dari database besar file PDF.
Ilmuwan data dan teknisi ML Anda juga dapat menggunakan Amazon SageMaker AI untuk mengakses langsung data yang diekstraksi di bucket S3 atau tabel Amazon DynamoDB dan kemudian menerapkan pemodelan dan prediksi HTML tingkat lanjut.
Praktik terbaik untuk fase analisis
Anda dapat menggunakan dua praktik terbaik berikut untuk memastikan fase analitik yang sukses:
-
Buat file manifes untuk menggunakan bucket S3 sebagai sumber data. QuickSight Untuk informasi selengkapnya tentang ini, lihat Membuat analisis menggunakan data Amazon S3 Anda sendiri dalam dokumentasi. QuickSight
-
Perbarui kumpulan data Anda secara otomatis untuk menangkap data baru yang ditambahkan ke Amazon S3 dan menyegarkan dasbor Anda. Untuk informasi selengkapnya tentang ini, lihat Menyegarkan kumpulan data pada jadwal dalam dokumentasi. QuickSight