Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menghubungkan Katalog Data ke metastore Hive eksternal
Untuk menghubungkan AWS Glue Data Catalog ke metastore Hive, Anda perlu menerapkan aplikasi yang AWS SAM disebut -. GlueDataCatalogFederation HiveMetastore
AWS SAM Aplikasi ini membuat koneksi untuk metastore Hive di belakang Amazon API Gateway menggunakan fungsi Lambda. AWS SAM Aplikasi ini menggunakan pengenal sumber daya seragam (URI) sebagai masukan dari pengguna dan menghubungkan metastore Hive eksternal ke Katalog Data. Saat pengguna menjalankan kueri pada tabel Hive, Katalog Data memanggil titik akhir API Gateway. Titik akhir memanggil fungsi Lambda untuk mengambil metadata tabel Hive.
Untuk menghubungkan Katalog Data ke metastore Hive dan mengatur izin
-
Menyebarkan AWS SAM aplikasi.
Masuk ke AWS Management Console dan buka AWS Serverless Application Repository.
Di panel navigasi, pilihAplikasi yang tersedia.
-
Pilih aplikasi Publik.
Pilih opsiMenampilkan aplikasi yang membuat IAM role khusus atau kebijakan sumber daya.
Di kotak pencarian, masukkan nama GlueDataCatalogFederation- HiveMetastore.
-
Pilih GlueDataCatalogFederation- HiveMetastore aplikasi.
-
Di bawah Pengaturan Aplikasi, masukkan pengaturan minimum yang diperlukan berikut untuk fungsi Lambda Anda:
Nama aplikasi - Nama untuk AWS SAM aplikasi Anda.
GlueConnectionName- Nama untuk koneksi.
HiveMetastoreURI - URI host metastore Hive Anda.
-
LambdaMemory- Jumlah memori Lambda dalam MB dari 128-10240. Defaultnya adalah 1.024.
LambdaTimeout- Runtime pemanggilan Lambda maksimum dalam hitungan detik. Bawaannya adalah 30.
VPC dan SecurityGroupIds VPC SubnetIds - Informasi untuk VPC tempat metastore Hive ada.
Pilih Saya mengakui bahwa aplikasi ini membuat peran IAM khusus dan kebijakan sumber daya. Untuk informasi selengkapnya, pilih tautan Info.
Di kanan bawah bagian Pengaturan aplikasi, pilih Deploy. Saat penerapan selesai, fungsi Lambda muncul di bagian Sumber Daya di konsol Lambda.
Aplikasi ini digunakan untuk Lambda. Namanya dilengkapi dengan serverlessrepo- untuk menunjukkan bahwa aplikasi tersebut digunakan dari file. AWS Serverless Application Repository Memilih aplikasi akan membawa Anda ke halaman Sumber Daya tempat masing-masing sumber daya aplikasi yang digunakan terdaftar. Sumber daya termasuk fungsi Lambda yang memungkinkan komunikasi antara Katalog Data dan metastore Hive, AWS Glue koneksi, dan sumber daya lain yang diperlukan untuk federasi database.
-
Buat database federasi di Katalog Data.
Setelah membuat koneksi ke metastore Hive, Anda dapat membuat database federasi di Katalog Data yang mengarah ke database metastore Hive eksternal. Anda perlu membuat database yang sesuai di Katalog Data untuk setiap database metastore Hive yang Anda sambungkan ke Katalog Data.
-
Lihat tabel dalam database federasi.
Setelah membuat database federasi, Anda dapat melihat daftar tabel di metastore Hive Anda menggunakan konsol Lake Formation atau. AWS CLI
-
Berikan izin.
Setelah membuat database, Anda dapat memberikan izin kepada pengguna dan peran IAM lainnya di akun Anda atau ke eksternal Akun AWS dan organisasi. Anda tidak akan dapat memberikan izin menulis data (menyisipkan, menghapus) dan izin metadata (mengubah, menjatuhkan, membuat) pada database federasi. Untuk informasi selengkapnya tentang pemberian izin, lihat. Mengelola izin Lake Formation
-
Kueri database federasi.
Setelah Anda memberikan izin, pengguna dapat masuk dan mulai menanyakan database federasi menggunakan Athena dan Amazon Redshift. Pengguna sekarang dapat menggunakan nama database lokal untuk referensi database Hive dalam query SQL.
Contoh sintaks Amazon Athena kueri
Ganti
fed_glue_db
dengan nama database lokal yang Anda buat sebelumnya.Select * from fed_glue_db.customers limit 10;