Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Siklus hidup danau data
Membangun danau data biasanya melibatkan lima tahap:
-
Menyiapkan penyimpanan
-
Memindahkan data
-
Mempersiapkan dan membuat katalog data
-
Mengkonfigurasi kebijakan keamanan
-
Membuat data tersedia untuk konsumsi
Gambar berikut adalah diagram arsitektur tingkat tinggi dari data lake pusat kontak Amazon Connect yang terintegrasi dengan analitik AWS dan layanan kecerdasan buatan/pembelajaran mesin (AI/ML). Bagian berikut mencakup skenario dan layanan AWS yang ditunjukkan pada gambar ini.

Data lake pusat kontak Amazon Connect dengan analitik AWS dan layanan AI/ML
Penyimpanan
Amazon S3
Bucket dan objek S3 bersifat pribadi dengan Akses Publik Blok S3 diaktifkan secara default ke semua Wilayah secara global. Anda dapat menyiapkan kontrol akses terpusat pada sumber daya S3 menggunakan kebijakan bucket, kebijakan AWS Identity and Access Management
AWS CloudTrail
S3 Intelligent-Tiering
Menyimpan data dalam format kolumnar seperti Apache Parquet
Dengan S3 Select dan S3 Glacier Select, Anda dapat melakukan kueri metadata objek menggunakan ekspresi bahasa kueri terstruktur (SQL) tanpa memindahkan objek ke penyimpanan data lain.
Operasi Batch S3
S3 Access Points
S3 Transfer Acceleration
Seiring pertumbuhan data lake Anda, S3 Storage Lens
Tertelan
AWS menyediakan portofolio layanan transfer data yang komprehensif untuk memindahkan data yang ada ke dalam data lake terpusat. Amazon Storage Gateway
-
AWS Storage Gatewaymemperluas lingkungan lokal Anda ke penyimpanan AWS dengan mengganti pustaka tape dengan penyimpanan cloud, menyediakan berbagi file yang didukung penyimpanan cloud, atau membuat cache latensi rendah untuk mengakses data Anda di AWS dari lingkungan lokal.
-
AWS Direct Connectmenetapkan konektivitas pribadi antara lingkungan lokal Anda dan AWS untuk mengurangi biaya jaringan, meningkatkan throughput, dan memberikan pengalaman jaringan yang konsisten.
-
AWS DataSync dapat mentransfer jutaan file ke S3, Amazon Elastic File System
(Amazon EFS), atau Amazon FSx untuk Windows File Server sambil mengoptimalkan pemanfaatan jaringan. -
Amazon Kinesis menyediakan cara aman untuk menangkap dan memuat data streaming ke S3. Amazon Data Firehose
adalah layanan yang dikelola sepenuhnya untuk mengirimkan data streaming real-time langsung ke S3. Firehose secara otomatis menskalakan agar sesuai dengan volume dan throughput data streaming dan tidak memerlukan administrasi berkelanjutan. Anda dapat mengubah data streaming menggunakan kompresi, enkripsi, pengelompokan data, atau AWS Lambda fungsi dalam Firehose sebelum menyimpan data di S3. Enkripsi Firehose mendukung enkripsi sisi server S3 dengan (). AWS Key Management Service AWS KMS Atau, Anda dapat mengenkripsi data dengan kunci khusus Anda. Firehose dapat menggabungkan dan mengirimkan beberapa catatan masuk sebagai objek S3 tunggal untuk mengurangi biaya dan mengoptimalkan throughput. AWS Snow Family menyediakan mekanisme transfer data offline. AWS Snowball Edge
menghadirkan perangkat komputasi tepi portabel dan kokoh untuk pengumpulan, pemrosesan, dan migrasi data. Untuk transfer data skala exabyte, Anda dapat menggunakan AWS Snowmobile untuk memindahkan volume data besar-besaran ke cloud. DistCp
menyediakan kemampuan salinan terdistribusi untuk memindahkan data dalam ekosistem Hadoop. S3 DisctCp adalah ekstensi untuk DistCp dioptimalkan untuk memindahkan data antara Hadoop Distributed File System (HDFS) dan S3. Blog ini memberikan informasi tentang cara memindahkan data antara HDFS dan S3 menggunakan S3. DistCp
Katalogisasi
Salah satu tantangan umum dengan arsitektur data lake adalah kurangnya pengawasan pada isi data mentah yang disimpan di danau data. Organizations membutuhkan tata kelola, konsistensi semantik, dan kontrol akses untuk menghindari jebakan menciptakan rawa data tanpa kurasi.
AWS Lake Formation
AWS Glue DataBrew
Keamanan
Amazon Connect memisahkan data berdasarkan ID akun AWS dan ID instans Amazon Connect untuk memastikan akses data resmi pada tingkat instans Amazon Connect.
Amazon Connect mengenkripsi data kontak informasi identitas pribadi (PII) dan profil pelanggan saat istirahat menggunakan kunci terbatas waktu khusus untuk instans Amazon Connect Anda. Enkripsi sisi server S3 mengamankan rekaman suara dan obrolan saat istirahat menggunakan kunci data KMS unik per akun AWS. Anda mempertahankan kontrol keamanan lengkap untuk mengonfigurasi akses pengguna ke rekaman panggilan di bucket S3 Anda, termasuk melacak siapa yang mendengarkan atau menghapus rekaman panggilan. Amazon Connect mengenkripsi cetak suara pelanggan dengan kunci KMS milik layanan untuk melindungi identitas pelanggan. Semua data yang dipertukarkan antara Amazon Connect dan layanan AWS lainnya, atau aplikasi eksternal selalu dienkripsi dalam perjalanan menggunakan enkripsi transport layer security (TLS) standar industri.
Mengamankan data lake memerlukan kontrol berbutir halus untuk memastikan akses dan penggunaan data yang sah. Sumber daya S3 bersifat pribadi dan hanya dapat diakses oleh pemilik sumber dayanya secara default. Pemilik sumber daya dapat membuat kombinasi kebijakan IAM berbasis sumber daya atau berbasis identitas untuk memberikan dan mengelola izin ke bucket dan objek S3. Kebijakan berbasis sumber daya seperti kebijakan bucket dan ACLs dilampirkan pada sumber daya. Sebaliknya, kebijakan berbasis identitas dilampirkan ke pengguna, grup, atau peran IAM di akun AWS Anda.
Kami merekomendasikan kebijakan berbasis identitas untuk sebagian besar lingkungan data lake untuk menyederhanakan manajemen akses sumber daya dan izin layanan untuk pengguna data lake Anda. Anda dapat membuat pengguna, grup, dan peran IAM di akun AWS dan mengaitkannya dengan kebijakan berbasis identitas yang memberikan akses ke sumber daya S3.
Model AWS Lake Formation izin bekerja bersama dengan izin IAM untuk mengatur akses danau data. Model izin Lake Formation menggunakan mekanisme GRANT atau REVOKE gaya sistem manajemen basis data (DBMS). Izin IAM berisi kebijakan berbasis identitas. Misalnya, pengguna harus lulus pemeriksaan izin dengan izin IAM dan Lake Formation sebelum mengakses sumber daya data lake.
AWS CloudTrail melacak panggilan Amazon Connect API, termasuk alamat IP dan identitas pemohon serta tanggal dan waktu permintaan dalam Riwayat CloudTrail Acara. Membuat AWS CloudTrail jejak memungkinkan pengiriman AWS CloudTrail log secara terus menerus ke bucket S3 Anda.
Amazon Athena Workgroups dapat memisahkan eksekusi kueri dan mengontrol akses oleh pengguna, tim, atau aplikasi menggunakan kebijakan berbasis sumber daya. Anda dapat menerapkan kontrol biaya dengan membatasi penggunaan data pada Workgroups.
Pemantauan
Observabilitas sangat penting untuk memastikan ketersediaan, keandalan, dan kinerja pusat kontak dan danau data. Amazon CloudWatch
Amazon Connect mengirimkan data penggunaan instans sebagai CloudWatch metrik Amazon dalam interval satu menit. Retensi data untuk CloudWatch metrik Amazon adalah dua minggu. Tentukan persyaratan penyimpanan log dan kebijakan siklus hidup sejak dini untuk memastikan kepatuhan terhadap peraturan dan penghematan biaya untuk arsip data jangka panjang.
Amazon CloudWatch Logs menyediakan cara sederhana untuk memfilter data log dan mengidentifikasi peristiwa ketidakpatuhan untuk investigasi insiden dan mempercepat resolusi. Anda dapat menyesuaikan alur kontak untuk mendeteksi penelepon berisiko tinggi atau aktivitas yang berpotensi curang. Misalnya, Anda dapat memutuskan kontak masuk yang ada di daftar Tolak yang telah ditentukan sebelumnya.
Analitik
Data lake pusat kontak yang dibangun di atas portofolio analitik deskriptif, prediktif, dan real-time membantu Anda mengekstrak wawasan yang bermakna dan menanggapi pertanyaan bisnis penting.
Setelah data Anda mendarat di data lake S3, Anda dapat menggunakan layanan analitik yang dibuat khusus seperti Amazon Athena dan Amazon QuickSight
Untuk solusi pergudangan data yang sangat skalabel, Anda dapat mengaktifkan streaming data di Amazon Connect untuk mengalirkan catatan kontak ke Amazon Redshift melalui Amazon Kinesis
Machine learning
Membangun data lake membawa paradigma baru untuk arsitektur pusat kontak, memberdayakan bisnis Anda untuk memberikan layanan pelanggan yang ditingkatkan dan dipersonalisasi menggunakan kemampuan pembelajaran mesin (ML).
Pengembangan ML tradisional adalah proses yang kompleks dan mahal. AWS menyediakan kedalaman dan luasnya infrastruktur berkinerja tinggi, hemat biaya, terukur, dan layanan ML
Amazon SageMaker AI
Mengurangi gesekan dalam perjalanan pelanggan sangat penting untuk menghindari churn pelanggan. Untuk menambahkan kecerdasan ke pusat kontak Anda, Anda dapat membangun chatbot percakapan bertenaga AI menggunakan kemampuan Amazon
Memahami dinamika agen penelepon sangat penting untuk meningkatkan kualitas layanan secara keseluruhan. Lihat blog ini
Untuk organisasi dengan kehadiran internasional, Anda dapat membangun pengalaman suara multibahasa
Perangkat lunak perencanaan keuangan tradisional membuat perkiraan berdasarkan data deret waktu historis tanpa menghubungkan tren yang tidak konsisten dan variabel yang relevan. Amazon Forecast
Amazon Connect menyediakan atribut panggilan dari operator telepon, seperti lokasi geografis peralatan suara untuk menunjukkan asal panggilan, jenis perangkat telepon seperti telepon rumah atau seluler, jumlah segmen jaringan yang dilalui panggilan, dan informasi asal panggilan lainnya. Menggunakan Amazon Fraud Detector