Integrasikan Amazon EMR dengan AWS Lake Formation - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Integrasikan Amazon EMR dengan AWS Lake Formation

AWS Lake Formation adalah layanan terkelola yang membantu Anda menemukan, membuat katalog, membersihkan, dan mengamankan data di danau data Amazon Simple Storage Service (S3). Lake Formation menyediakan akses tingkat kolom berbutir halus ke database dan tabel di Katalog Data Glue. AWS Untuk informasi selengkapnya, lihat Apa itu AWS Lake Formation?

Dengan EMR rilis Amazon 6.7.0 dan yang lebih baru, Anda dapat menerapkan kontrol akses berbasis Lake Formation ke pekerjaan Spark, Hive, dan Presto yang Anda kirimkan ke cluster Amazon. EMR Untuk berintegrasi dengan Lake Formation, Anda harus membuat EMR cluster dengan peran runtime. Peran runtime adalah peran AWS Identity and Access Management (IAM) yang Anda kaitkan dengan EMR pekerjaan atau kueri Amazon. Amazon EMR kemudian menggunakan peran ini untuk mengakses AWS sumber daya. Untuk informasi selengkapnya, lihat Peran runtime untuk langkah-langkah Amazon EMR.

Bagaimana Amazon EMR bekerja dengan Lake Formation

Setelah mengintegrasikan Amazon EMR dengan Lake Formation, Anda dapat menjalankan kueri ke EMR klaster Amazon dengan StepAPIatau dengan SageMaker Studio. Kemudian, Lake Formation menyediakan akses ke data melalui kredensil sementara untuk Amazon. EMR Proses ini disebut credential vending. Untuk informasi selengkapnya, lihat Apa itu AWS Lake Formation?

Berikut ini adalah ikhtisar tingkat tinggi tentang bagaimana Amazon EMR mendapatkan akses ke data yang dilindungi oleh kebijakan keamanan Lake Formation.

Bagaimana Amazon EMR mengakses data yang dilindungi oleh kebijakan keamanan Lake Formation
  1. Pengguna mengirimkan EMR kueri Amazon untuk data di Lake Formation.

  2. Amazon EMR meminta kredensi sementara dari Lake Formation untuk memberikan akses data pengguna.

  3. Lake Formation mengembalikan kredensi sementara.

  4. Amazon EMR mengirimkan permintaan kueri untuk mengambil data dari Amazon S3.

  5. Amazon EMR menerima data dari Amazon S3, memfilternya, dan mengembalikan hasil berdasarkan izin pengguna yang ditentukan pengguna di Lake Formation.

Untuk informasi selengkapnya tentang penambahan pengguna dan grup ke kebijakan Lake Formation, lihat Memberikan izin Katalog Data.

Prasyarat

Anda harus memenuhi persyaratan berikut sebelum mengintegrasikan Amazon EMR dan Lake Formation:

  • Aktifkan otorisasi peran runtime di klaster Amazon EMR Anda.

  • Gunakan AWS Glue Data Catalog sebagai toko metadata Anda.

  • Tentukan dan kelola izin di Lake Formation untuk mengakses database, tabel, dan kolom di AWS Glue Data Catalog. Untuk informasi selengkapnya, lihat Apa itu AWS Lake Formation?