Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Propagasi Identitas Tepercaya dengan AWS Glue ETL
Dengan IAM Identity Center, Anda dapat terhubung ke penyedia identitas (IdPs) dan mengelola akses secara terpusat untuk pengguna dan grup di seluruh layanan AWS analitik. Anda dapat mengintegrasikan penyedia identitas seperti Okta, Ping, dan Microsoft Entra ID (sebelumnya Azure Active Directory) dengan IAM Identity Center bagi pengguna di organisasi Anda untuk mengakses data menggunakan pengalaman masuk tunggal. IAM Identity Center juga mendukung menghubungkan penyedia identitas pihak ketiga tambahan.
Dengan AWS Glue 5.0 dan lebih tinggi, Anda dapat menyebarkan identitas pengguna dari IAM Identity Center ke sesi interaktif. AWS Glue AWS Glue Sesi Interaktif selanjutnya akan menyebarkan identitas yang disediakan ke layanan hilir seperti Amazon S3 Access Grants, AWS Lake Formation dan Amazon Redshift, memungkinkan akses data yang aman melalui identitas pengguna di layanan hilir ini.
Gambaran Umum
Identity Center adalah pendekatan yang direkomendasikan untuk otentikasi dan otorisasi tenaga kerja AWS untuk organisasi dari berbagai ukuran dan jenis. Dengan Identity Center, Anda dapat membuat dan mengelola identitas pengguna di AWS, atau menghubungkan sumber identitas yang ada, termasuk Microsoft Active Directory, Okta, Ping Identity, Google Workspace JumpCloud, dan Microsoft Entra ID (sebelumnya Azure AD).
Propagasi identitas tepercaya adalah fitur Pusat Identitas IAM yang dapat digunakan oleh administrator AWS layanan terhubung untuk memberikan dan mengaudit akses ke data layanan. Akses ke data ini didasarkan pada atribut pengguna seperti asosiasi grup. Menyiapkan propagasi identitas tepercaya memerlukan kolaborasi antara administrator AWS layanan yang terhubung dan administrator Pusat Identitas IAM.
Fitur dan manfaat
Integrasi sesi AWS Glue interaktif dengan IAM Identity Center Penyebaran identitas tepercaya memberikan manfaat berikut:
Kemampuan untuk menegakkan otorisasi tingkat tabel dan kontrol akses berbutir halus dengan identitas Pusat Identitas pada tabel katalog data terkelola Lake Formation. AWS Glue
Kemampuan untuk menegakkan otorisasi dengan identitas Pusat Identitas di cluster Amazon Redshift.
Memungkinkan pelacakan ujung ke ujung tindakan pengguna untuk audit.
Kemampuan untuk menegakkan otorisasi tingkat awalan Amazon S3 dengan identitas Pusat Identitas pada awalan Amazon S3 Access Grants yang dikelola Amazon S3.
Kasus penggunaan
Eksplorasi dan Analisis Data Interaktif
Insinyur data menggunakan identitas perusahaan mereka untuk mengakses dan menganalisis data dengan mulus di beberapa AWS akun. Melalui SageMaker Studio, mereka meluncurkan sesi Spark interaktif melalui AWS Glue ETL, menghubungkan ke berbagai sumber data termasuk Amazon S3 dan AWS Glue Katalog Data. Saat para insinyur menjelajahi kumpulan data, Spark memberlakukan kontrol akses berbutir halus yang ditentukan dalam Lake Formation berdasarkan identitas mereka, memastikan mereka hanya dapat melihat data resmi. Semua kueri dan transformasi data dicatat dengan identitas pengguna, menciptakan jejak audit yang jelas. Pendekatan yang efisien ini memungkinkan pembuatan prototipe cepat produk analitik baru sambil mempertahankan tata kelola data yang ketat di seluruh lingkungan klien.
Persiapan Data dan Rekayasa Fitur
Ilmuwan data dari beberapa tim peneliti berkolaborasi dalam proyek kompleks menggunakan platform data terpadu. Mereka masuk ke SageMaker Studio dengan kredensi perusahaan mereka, segera mengakses danau data bersama yang luas yang mencakup banyak akun. AWS Saat mereka memulai rekayasa fitur untuk model pembelajaran mesin baru, sesi Spark diluncurkan melalui AWS Glue ETL menegakkan kolom Lake Formation dan kebijakan keamanan tingkat baris berdasarkan identitas mereka yang disebarkan. Para ilmuwan dapat secara efisien menyiapkan data dan fitur insinyur menggunakan alat yang sudah dikenal, sementara tim kepatuhan memiliki jaminan bahwa setiap interaksi data dilacak dan diaudit secara otomatis. Lingkungan kolaboratif yang aman ini mempercepat jalur penelitian sambil mempertahankan standar perlindungan data yang ketat yang diperlukan dalam industri yang diatur.
Cara kerjanya

Pengguna masuk ke aplikasi yang menghadap klien (SageMaker AI, atau aplikasi khusus) menggunakan identitas perusahaan mereka melalui IAM Identity Center. Identitas ini kemudian disebarkan melalui seluruh jalur akses data.
Pengguna yang diautentikasi meluncurkan Sesi AWS AWS Glue Interaktif, yang berfungsi sebagai mesin komputasi untuk pemrosesan data. Sesi ini mempertahankan konteks identitas pengguna di seluruh alur kerja.
AWS Lake Formation dan AWS Glue Data Catalog bekerja sama untuk menegakkan kontrol akses berbutir halus. Lake Formation menerapkan kebijakan keamanan berdasarkan identitas yang disebarkan pengguna, sementara Amazon S3 Access Grant menyediakan lapisan izin tambahan, memastikan pengguna hanya dapat mengakses data yang diizinkan untuk dilihat.
Akhirnya, sistem terhubung ke Penyimpanan Amazon S3 tempat data aktual berada. Semua akses diatur oleh kebijakan keamanan gabungan, menjaga tata kelola data sambil memungkinkan eksplorasi dan analisis data interaktif. Arsitektur ini memungkinkan akses data berbasis identitas yang aman di berbagai AWS layanan sambil mempertahankan pengalaman pengguna yang mulus bagi ilmuwan dan insinyur data yang bekerja dengan kumpulan data besar.
Integrasi
AWS lingkungan pengembangan terkelola
Aplikasi yang dihadapi klien AWS terkelola berikut ini mendukung propagasi identitas tepercaya dengan AWS Glue sesi interaktif:
Studio Terpadu Sagemaker
Untuk menggunakan propagasi identitas tepercaya dengan Sagemaker Unified Studio:
Siapkan proyek Sagemaker Unified Studio dengan propagasi identitas tepercaya yang diaktifkan sebagai lingkungan pengembangan yang menghadap klien.
Siapkan Lake Formation untuk mengaktifkan kontrol akses berbutir halus untuk AWS Glue tabel berdasarkan pengguna atau grup di Pusat Identitas IAM.
Siapkan Hibah Akses Amazon S3 untuk mengaktifkan akses sementara ke lokasi data yang mendasarinya di Amazon S3.
Buka ruang JupyterLab IDE Sagemaker Unified Studio dan pilih AWS Glue sebagai komputasi untuk eksekusi notebook.
Lingkungan Notebook yang dihosting sendiri yang dikelola pelanggan
Untuk mengaktifkan propagasi identitas tepercaya bagi pengguna aplikasi yang dikembangkan khusus, lihat Akses AWS layanan secara terprogram menggunakan propagasi identitas tepercaya