Menggunakan AWS Lake Formation dengan AWS Glue - AWS Lake Formation

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan AWS Lake Formation dengan AWS Glue

Insinyur data dan DevOps profesional menggunakan AWS Glue Extract, Transform and Load (ETL) dengan Apache Spark untuk melakukan transformasi pada kumpulan data mereka di Amazon S3 dan memuat data yang diubah ke dalam data lake dan gudang data untuk analitik, pembelajaran mesin, dan pengembangan aplikasi. Dengan tim yang berbeda mengakses kumpulan data yang sama di Amazon S3, sangat penting untuk memberikan dan membatasi izin berdasarkan peran mereka.

AWS Lake Formation dibangun di atas AWS Glue, dan layanan berinteraksi dengan cara berikut:

  • Lake Formation dan AWS Glue berbagi Katalog Data yang sama.

  • Fitur konsol Lake Formation berikut memanggil AWS Glue konsol:

  • Alur kerja yang dihasilkan saat Anda menggunakan cetak biru Lake Formation adalah alur kerja. AWS Glue Anda dapat melihat dan mengelola alur kerja ini di konsol Lake Formation dan AWS Glue konsol.

  • Transformasi pembelajaran mesin disediakan dengan Lake Formation dan dibangun di atas operasi AWS Glue API. Anda membuat dan mengelola transformasi pembelajaran mesin di AWS Glue konsol. Untuk informasi selengkapnya, lihat Transformasi Machine Learning di Panduan AWS Glue Pengembang.

Anda dapat menggunakan kontrol akses berbutir halus Lake Formation untuk mengelola sumber daya Katalog Data dan lokasi data Amazon S3 yang ada.

catatan

AWS Glue ETL memerlukan akses penuh ke seluruh tabel saat mengambil data dari lokasi Amazon S3 yang mendasarinya. AWS Glue Pekerjaan ETL gagal jika Anda menerapkan izin tingkat kolom di atas meja.

Support untuk tipe tabel transaksional

Menerapkan izin Lake Formation memungkinkan Anda mengamankan data transaksional di danau data berbasis Amazon S3. Tabel di bawah ini mencantumkan format tabel transaksional yang didukung dalam AWS Glue dan izin Lake Formation. Lake Formation memberlakukan izin ini untuk AWS Glue operasi.

Format tabel yang didukung
Format tabel Deskripsi dan operasi yang diizinkan Izin Lake Formation didukung di AWS Glue

Apache Hudi

Format tabel terbuka yang digunakan untuk menyederhanakan pemrosesan data tambahan dan pengembangan pipa data.

Sebagai contoh, lihat Menggunakan kerangka kerja Hudi di. AWS Glue

Izin tingkat tabel tersedia untuk tabel Hudi.

Untuk informasi selengkapnya, lihat Batas.

Gunung Es Apache

Format tabel terbuka yang mengelola koleksi besar file sebagai tabel.

Sebagai contoh, lihat Menggunakan kerangka Iceberg di. AWS Glue

Izin tingkat tabel tersedia untuk tabel Iceberg.

Untuk informasi selengkapnya, lihat Batas.

Yayasan Linux Delta Lake

Delta Lake adalah proyek sumber terbuka yang membantu mengimplementasikan arsitektur data lake modern yang biasanya dibangun di Amazon S3 atau Hadoop Distributed File System (HDFS).

Sebagai contoh, lihat Menggunakan kerangka Delta Lake di AWS Glue.

Izin tingkat tabel tersedia untuk tabel Delta Lake.

Untuk informasi selengkapnya, lihat Batas.

Sumber daya tambahan