Fase analisis - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Fase analisis

Dengan memproses file PDF, Anda mengekstrak konten yang dapat digunakan untuk pemrosesan dan analisis lebih lanjut. Misalnya, Anda dapat mengidentifikasi tren biaya dengan menggunakan bidang biaya laporan operasi harian atau menghasilkan wawasan dengan menggabungkan indikator kinerja utama (KPIs) untuk operasi bisnis. Anda juga dapat menggabungkan konten yang diekstraksi dengan sumber data lain, termasuk data lake, gudang data, data pihak ketiga, atau data manajemen hubungan pelanggan (CRM) untuk melakukan analisis bisnis yang mendalam.

Amazon QuickSight adalah layanan intelijen bisnis tanpa server yang terhubung ke bucket Amazon Simple Storage Service (Amazon S3) yang berisi data file PDF Anda yang diekstraksi. Analis bisnis Anda kemudian dapat membuat dasbor untuk menganalisis, memvisualisasikan, dan langsung menghasilkan wawasan dari file JSON di bucket S3. Dasbor terhubung ke bucket S3 dan diperbarui secara otomatis setelah file PDF baru diproses. Anda juga dapat berbagi dasbor dengan pengguna yang berbeda dan pengguna juga dapat berlangganan dasbor untuk melihatnya di perangkat seluler. Untuk informasi selengkapnya tentang ini, lihat Membuat kumpulan data menggunakan file Amazon S3 dalam dokumentasi Amazon QuickSight .

Sebagian besar file PDF juga berisi konten teks kaya di dalam formulir dan tabel atau dalam paragraf teks gratis. Setelah konten teks diekstraksi, konten teks kaya dapat digunakan oleh layanan kecerdasan AWS buatan dan pembelajaran mesin (AI/ML) lainnya yang dapat menangani pemrosesan bahasa alami (NLP), seperti Amazon Comprehend atau Amazon Translate. Anda juga dapat menggunakan Amazon Kendra untuk mengindeks dan mencari dokumen yang diekstrak dari database besar file PDF.

Ilmuwan data dan teknisi ML Anda juga dapat menggunakan Amazon SageMaker AI untuk mengakses langsung data yang diekstraksi di bucket S3 atau tabel Amazon DynamoDB dan kemudian menerapkan pemodelan dan prediksi HTML tingkat lanjut.

Praktik terbaik untuk fase analisis

Anda dapat menggunakan dua praktik terbaik berikut untuk memastikan fase analitik yang sukses: