Prasyarat untuk menghubungkan Katalog Data ke metastore Hive - AWS Lake Formation

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Prasyarat untuk menghubungkan Katalog Data ke metastore Hive

Untuk menghubungkan AWS Glue Data Catalog ke metastore Apache Hive eksternal dan mengatur izin akses data, Anda harus melengkapi persyaratan berikut:

catatan

Kami menyarankan agar administrator Lake Formation menyebarkan AWS SAM aplikasi, dan hanya pengguna istimewa yang menggunakan koneksi metastore Hive untuk membuat database federasi yang sesuai.

  1. Buat IAM role.
    Untuk menyebarkan aplikasi AWS SAM
    • Buat peran yang memiliki izin yang diperlukan untuk menyebarkan sumber daya (fungsi Lambda, peran IAM Amazon API Gateway, dan AWS Glue koneksi) yang diperlukan untuk membuat koneksi ke metastore Hive.

    Untuk membuat database federasi

    Izin berikut diperlukan pada sumber daya:

    • glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename

    • glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection

  2. Daftarkan lokasi Amazon S3 dengan Lake Formation.

    Untuk menggunakan Lake Formation untuk mengelola dan mengamankan data di danau data Anda, Anda harus mendaftarkan lokasi Amazon S3 yang memiliki data untuk tabel di metastore Hive dengan Lake Formation. Dengan demikian, Lake Formation dapat menjual kredensil ke layanan AWS analitis seperti Athena, Redshift Spectrum, dan Amazon EMR.

    Untuk informasi selengkapnya tentang mendaftarkan lokasi Amazon S3, lihat. Menambahkan lokasi Amazon S3 ke danau data Anda

    Saat Anda mendaftarkan lokasi Amazon S3, pilih kotak centang Aktifkan Federasi Katalog Data untuk mengizinkan Lake Formation mengambil peran untuk mengakses tabel dalam database federasi.

    Register location form for AWS Lake Formation with Amazon S3 path and IAM role options.

    Untuk informasi lebih lanjut tentang mendaftarkan lokasi data dengan Lake Formation, lihatKonfigurasikan lokasi Amazon S3 untuk data lake Anda.

  3. Gunakan versi EMR Amazon yang benar.

    Untuk menggunakan Amazon EMR dengan database metastore Hive federasi, Anda harus memiliki Hive versi 3.x atau lebih tinggi dan Amazon EMR versi 6.x atau lebih tinggi.