Membuat akses dan izin untuk repositori berbasis Git - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat akses dan izin untuk repositori berbasis Git

EMRStudio mendukung layanan berbasis Git berikut:

Untuk memungkinkan pengguna EMR Studio mengaitkan repositori Git dengan Workspace, siapkan persyaratan akses dan izin berikut. Anda juga dapat mengonfigurasi repositori berbasis Git yang Anda host di jaringan privat dengan mengikuti petunjuk di Konfigurasikan repositori Git yang dihosting secara pribadi untuk Studio EMR.

Akses internet klaster

EMRCluster Amazon yang berjalan di Amazon EC2 dan Amazon EMR pada EKS cluster yang dilampirkan ke Studio Workspaces harus berada dalam subnet pribadi yang menggunakan gateway terjemahan alamat jaringan (NAT), atau mereka harus dapat mengakses internet melalui gateway pribadi virtual. Untuk informasi selengkapnya, lihat VPCOpsi Amazon saat Anda meluncurkan cluster.

Grup keamanan yang Anda gunakan dengan EMR Studio juga harus menyertakan aturan keluar yang memungkinkan Ruang Kerja merutekan lalu lintas ke internet dari klaster terlampirEMR. Untuk informasi selengkapnya, lihat Tentukan grup keamanan untuk mengontrol lalu lintas jaringan EMR Studio.

penting

Jika antarmuka jaringan berada dalam subnet publik, itu tidak akan dapat berkomunikasi dengan internet melalui gateway internet (IGW).

Izin untuk AWS Secrets Manager

Untuk memungkinkan pengguna EMR Studio mengakses repositori Git dengan rahasia yang disimpan AWS Secrets Manager, tambahkan kebijakan izin ke peran layanan untuk EMR Studio yang memungkinkan pengoperasian. secretsmanager:GetSecretValue

Untuk informasi tentang cara menautkan repositori berbasis Git ke Workspace, lihat Tautkan repositori berbasis Git ke Ruang Kerja Studio EMR.

Konfigurasikan repositori Git yang dihosting secara pribadi untuk Studio EMR

Gunakan petunjuk berikut untuk mengonfigurasi repositori yang dihosting secara pribadi untuk Amazon Studio. EMR Berikan file konfigurasi dengan informasi tentang server Anda DNS dan Git. EMRStudio menggunakan informasi ini untuk mengonfigurasi Ruang Kerja yang dapat merutekan lalu lintas ke repositori yang dikelola sendiri.

catatan

Jika Anda mengonfigurasiDnsServerIpV4, EMR Studio menggunakan DNS server Anda untuk menyelesaikan EMR titik akhir Amazon GitServerDnsName dan Anda, sepertielasticmapreduce.us-east-1.amazonaws.com. Untuk menyiapkan endpoint untuk AmazonEMR, sambungkan ke endpoint Anda melalui VPC yang Anda gunakan dengan Studio Anda. Ini memastikan bahwa EMR titik akhir Amazon menyelesaikan ke IP pribadi. Untuk informasi selengkapnya, lihat Connect ke Amazon EMR menggunakan VPC endpoint antarmuka.

Prasyarat

Sebelum mengonfigurasi repositori Git yang dihosting secara pribadi untuk EMR Studio, Anda memerlukan lokasi penyimpanan Amazon S3 tempat EMR Studio dapat mencadangkan file Workspaces dan notebook di Studio. Gunakan bucket S3 yang sama dengan yang Anda tentukan saat Anda membuat Studio.

Untuk mengonfigurasi satu atau beberapa repositori Git yang dihosting secara pribadi untuk Studio EMR
  1. Buat file konfigurasi menggunakan template berikut. Sertakan nilai berikut untuk setiap server Git yang ingin Anda tentukan dalam konfigurasi Anda:

    • DnsServerIpV4- IPv4 Alamat DNS server Anda. Jika Anda memberikan nilai untuk keduanya DnsServerIpV4 danGitServerIpV4List, nilai untuk DnsServerIpV4 diutamakan dan EMR Studio gunakan DnsServerIpV4 untuk menyelesaikannya. GitServerDnsName

      catatan

      Untuk menggunakan repositori Git yang dihosting secara pribadi, DNS server Anda harus mengizinkan akses masuk dari Studio. EMR Kami mendorong Anda untuk mengamankan DNS server Anda dari akses lain yang tidak sah.

    • GitServerDnsName- DNS Nama server Git Anda. Sebagai contoh, "git.example.com".

    • GitServerIpV4List- Daftar IPv4 alamat milik server Git Anda.

    [ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ]
  2. Simpan file konfigurasi Anda sebagai configuration.json.

  3. Unggah file konfigurasi ke lokasi penyimpanan Amazon S3 Anda dalam folder bernama. life-cycle-configuration Misalnya, jika lokasi S3 default Andas3://amzn-s3-demo-bucket/studios, file konfigurasi Anda akan masuks3://amzn-s3-demo-bucket/studios/life-cycle-configuration/configuration.json.

    penting

    Kami mendorong Anda untuk membatasi akses ke life-cycle-configuration folder Anda ke administrator Studio dan peran layanan EMR Studio Anda, dan bahwa Anda mengamankan configuration.json terhadap akses yang tidak sah. Untuk instruksi, lihat Mengontrol akses ke bucket dengan kebijakan pengguna atau Praktik Terbaik Keamanan untuk Amazon S3.

    Untuk instruksi pengunggahan, lihat Membuat folder dan Pengunggahan objek dalam Panduan Pengguna Amazon Storage Service. Untuk menerapkan konfigurasi ke Workspace yang ada, tutup dan mulai ulang Workspace setelah Anda mengunggah file konfigurasi ke Amazon S3.