Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Konsumen data
Konsumen data mengkonsumsi data dari produsen data setelah katalog terpusat membagikannya menggunakan AWS Lake Formation. Diagram berikut menunjukkan dua konsumen data di danau data.

Ada dua jenis konsumen data: aplikasi dan penyajian data. Tabel berikut menjelaskan kedua jenis ini.
Jenis aplikasi |
Konsumen data aplikasi menjalankan aplikasi sendiri Akun AWS. Aplikasi menggunakan peran AWS Identity and Access Management (IAM) untuk mengakses data bersama dari produsen data dan kemudian memprosesnya sesuai dengan logika mereka. Biasanya, jenis data konsumen ini memiliki persyaratan data preskriptif untuk memenuhi kebutuhan aplikasi. |
Jenis penyajian data |
Konsumen data yang melayani data biasanya ditujukan untuk individu (misalnya, analis data atau ilmuwan data) dan aplikasi (misalnya, aplikasi intelijen bisnis) yang tidak memiliki milik mereka sendiri. Akun AWS Beberapa konsumen data yang melayani data dapat eksis di danau data satu organisasi. Misalnya, lini bisnis yang berbeda mungkin memilih untuk menyiapkan konsumen data yang melayani data mereka sendiri untuk membantu pengguna mengkonsumsi data dari data lake. Konsumen data ini memiliki prinsip peran IAM mereka sendiri yang dikonfigurasi dalam Akun AWS (misalnya, peran IAM yang terkait dengan AWS IAM Identity Center) yang digunakan oleh pengguna akhir di akun konsumen data untuk mengakses data bersama melalui AWS layanan (misalnya, Amazon Athena). Biasanya, jenis data konsumen ini memiliki kebutuhan data yang luas dan terus meningkat. |
AWS Lake Formation adalah AWS layanan paling penting yang digunakan oleh konsumen data untuk berbagi data lintas akun dan mengakses katalog terpusat. Setelah database dibagikan oleh katalog terpusat, sumber daya bersama tersedia di Lake Formation di akun konsumen data. Akses data kemudian dapat diberikan kepada prinsipal IAM lokal di akun konsumen data, dengan izin dari produsen data, jika diperlukan. Data bersama kemudian dapat digunakan oleh AWS layanan yang terintegrasi dengan Lake Formation (misalnya, Amazon Athena dan AWS Glue). Anda dapat menggunakan AWS layanan berikut untuk mengakses data bersama di akun konsumen data:
-
Amazon Athena adalah layanan kueri interaktif yang membantu menganalisis data secara langsung di Amazon Simple Storage Service (Amazon S3) menggunakan SQL standar. Untuk informasi lebih lanjut tentang Athena dan Lake Formation, lihat Bagaimana Athena mengakses data yang terdaftar dengan Lake Formation di dokumentasi Amazon Athena.
-
Amazon Redshift Spectrum membantu Anda melakukan kueri dan mengambil data terstruktur dan semi-terstruktur secara efisien dari file di Amazon S3 tanpa harus memuat data ke dalam tabel Amazon Redshift. Untuk informasi lebih lanjut tentang Spektrum Pergeseran Merah dan Formasi Danau, lihat Menggunakan Spektrum Pergeseran Merah dengan Formasi Danau di dokumentasi Amazon Redshift.
-
AWS Glueadalah layanan ekstrak, transformasi, dan muat (ETL) yang dikelola sepenuhnya yang membuatnya sederhana dan hemat biaya untuk mengkategorikan data Anda, membersihkannya, memperkayanya, dan memindahkannya dengan andal antara berbagai penyimpanan data dan aliran data. Peran IAM terkait pekerjaan AWS Glue ETL dapat mengakses data lake data yang dikelola oleh Lake Formation jika memiliki izin akses yang diperlukan.
-
Amazon EMR membantu menjalankan kerangka kerja data besar (misalnya, Apache Hadoop dan Apache
Spark ) untuk memproses dan menganalisis data dalam jumlah besar. Untuk informasi selengkapnya tentang Amazon EMR dan Lake Formation, lihat Mengintegrasikan Amazon EMR dengan Lake Formation dalam dokumentasi Amazon EMR. -
Amazon QuickSight adalah layanan intelijen bisnis yang dapat diskalakan, tanpa server, embeddable, dan machine learning (ML) yang dapat Anda gunakan untuk menganalisis dan memvisualisasikan data dari data lake Anda. Untuk informasi lebih lanjut tentang QuickSight dan Lake Formation, lihat Mengotorisasi koneksi melalui Lake Formation dalam QuickSight dokumentasi.
-
Amazon SageMaker AI Data Wrangler (Data Wrangler) mengurangi waktu yang dibutuhkan untuk mengumpulkan dan menyiapkan data untuk ML. Untuk informasi selengkapnya tentang Data Wrangler dan Lake Formation, lihat Mempersiapkan Data ML dengan Amazon SageMaker AI Data Wrangler di dokumentasi Amazon AI. SageMaker