Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
AWS Glue Data Catalog Pemandangan bangunan
Dalam AWS Glue Data Catalog, tampilan adalah tabel virtual di mana konten didefinisikan oleh SQL kueri yang mereferensikan satu atau lebih tabel. Anda dapat membuat tampilan Katalog Data yang mereferensikan hingga 10 tabel menggunakan SQL editor untuk Amazon Athena, atau Amazon Redshift. Tabel referensi yang mendasari untuk tampilan dapat menjadi milik database yang sama atau database yang berbeda dalam Katalog Data yang sama Akun AWS.
Anda dapat mereferensikan AWS Glue tabel dan tabel standar dalam format tabel terbuka (OTF) seperti Apache Hudi
Membedakan tampilan Katalog Data dari jenis tampilan lainnya
Tampilan Katalog Data berbeda dari tampilan Apache Hive, Apache Spark, dan Amazon Athena. Tampilan Katalog Data adalah fitur asli dari AWS Glue Data Catalog, dan merupakan tampilan definer-created multi-dialek. Anda dapat membuat tampilan Katalog Data menggunakan salah satu layanan analitik yang didukung, seperti Athena atau Amazon Redshift Spectrum, dan mengakses tampilan yang sama menggunakan layanan analitik lain yang didukung. Di sisi lain, tampilan Apache Hive, Apache Spark, dan Athena dibuat secara independen di setiap layanan analitik, seperti Athena dan Amazon Redshift, dan hanya terlihat dan dapat diakses dalam layanan itu.
Apa itu pandangan yang lebih pasti?
Tampilan definer adalah SQL tampilan yang beroperasi berdasarkan izin prinsipal yang membuatnya. Peran definer memiliki izin yang diperlukan untuk mengakses tabel yang direferensikan, dan menjalankan SQL pernyataan yang mendefinisikan tampilan. Definer membuat tampilan dan membagikannya dengan pengguna lain melalui kontrol akses AWS Lake Formation berbutir halus.
Saat pengguna menanyakan tampilan definer, mesin kueri menggunakan izin peran definer untuk mengakses tabel referensi yang mendasarinya. Pendekatan ini memungkinkan pengguna untuk berinteraksi dengan tampilan tanpa memerlukan akses langsung ke tabel sumber, meningkatkan keamanan dan menyederhanakan manajemen akses data.
Untuk menyiapkan tampilan definer, definer harus menjadi IAM peran dalam AWS akun yang sama yang meng-host tampilan dalam Katalog Data-nya. Untuk informasi selengkapnya tentang izin yang diperlukan untuk peran definer, lihat. Prasyarat untuk membuat tampilan
Kerangka kerja untuk tampilan multi-dialek
Katalog Data mendukung pembuatan tampilan menggunakan beberapa dialek bahasa kueri terstruktur (SQL). SQLadalah bahasa yang digunakan untuk menyimpan dan memproses informasi dalam database relasional dan setiap mesin AWS analitik menggunakan variasiSQL, atau SQL dialeknya sendiri.
Anda membuat tampilan Katalog Data dalam satu SQL dialek menggunakan salah satu mesin kueri analitik yang didukung. Selanjutnya, Anda dapat memperbarui tampilan menggunakan ALTER VIEW
pernyataan dalam SQL dialek yang berbeda dalam mesin analitik lain yang didukung. Namun, setiap dialek harus mereferensikan kumpulan tabel, kolom, dan tipe data yang sama.
Anda dapat mengakses beberapa dialek yang tersedia untuk tampilan menggunakan GetTable
API, AWS CLI dan AWS konsol. Dengan demikian, tampilan Katalog Data terlihat dan tersedia untuk kueri di berbagai mesin analitik yang didukung.
Dengan mendefinisikan skema tampilan umum dan objek metadata yang dapat Anda kueri dari beberapa mesin, tampilan Katalog Data memungkinkan Anda menggunakan tampilan seragam di seluruh data lake Anda.
Untuk detail lebih lanjut tentang bagaimana skema diselesaikan untuk setiap dialek, lihat, tautan ke referensi. API Untuk detail selengkapnya tentang aturan pencocokan untuk berbagai jenis, lihat, tautan ke bagian yang relevan di API dokumen.
Mengintegrasikan dengan izin Lake Formation
Anda dapat menggunakan AWS Lake Formation untuk memusatkan manajemen izin pada AWS Glue Data Catalog tampilan untuk pengguna. Anda dapat memberikan izin berbutir halus pada tampilan Katalog Data menggunakan metode sumber daya bernama atau LF-tag, dan membagikannya di seluruh Akun AWS organisasi, dan unit organisasi. AWS Anda juga dapat berbagi dan mengakses tampilan Katalog Data Wilayah AWS menggunakan tautan sumber daya. Hal ini memungkinkan pengguna untuk menyediakan akses data tanpa menduplikasi sumber data, dan berbagi tabel yang mendasarinya.
CREATE VIEW
DDLPernyataan tampilan Katalog Data dapat mereferensikan AWS Glue tabel dan tabel standar dalam format tabel terbuka (OTF) seperti Hudi, Delta Lake, dan Iceberg dengan data dasar yang disimpan di lokasi Amazon S3 yang terdaftar di Lake Formation serta tabel federasi dari data Amazon Redshift yang dibagikan dengan Lake Formation. Tabel dapat berupa format file apa pun selama mesin yang digunakan untuk menanyakan tampilan mendukung format itu. Anda juga dapat mereferensikan fungsi bawaan dari mesin tempat ia dijalankan tetapi sumber daya khusus mesin lainnya mungkin tidak diizinkan. Untuk detail selengkapnya, lihat Katalog Data melihat pertimbangan dan batasan
Kasus penggunaan
Berikut ini adalah kasus penggunaan penting untuk tampilan Katalog Data:
Buat dan kelola izin pada skema tampilan tunggal. Ini membantu Anda menghindari risiko izin yang tidak konsisten pada tampilan duplikat yang dibuat di beberapa mesin.
Berikan izin kepada pengguna pada tampilan yang mereferensikan beberapa tabel tanpa memberikan izin langsung pada tabel referensi yang mendasarinya.
Mencapai pemfilteran tingkat baris pada tabel menggunakan LF-tag (di mana LF-tag hanya mengalir hingga tingkat kolom) dengan menerapkan LF-tag pada tampilan dan memberikan izin berbasis LF-tag kepada pengguna.
Layanan AWS analitik yang didukung untuk membuat tampilan
Layanan AWS analitik berikut mendukung pembuatan tampilan Katalog Data:
Amazon Redshift
Amazon Athena versi 3
Sumber daya tambahan
Anda dapat mempelajari lebih lanjut tentang Katalog Data dalam panduan ini, serta menggunakan sumber daya berikut:
Video berikut menunjukkan cara membuat tampilan dan menanyakannya dari Athena dan Amazon Redshift.