Prasyarat dan pertimbangan - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Prasyarat dan pertimbangan

catatan

EMR Notebooks tersedia sebagai EMR Studio Workspaces di konsol. Tombol Create Workspace di konsol memungkinkan Anda membuat notebook baru. Untuk mengakses atau membuat Ruang Kerja, pengguna EMR Notebooks memerlukan izin peran IAM tambahan. Untuk informasi selengkapnya, lihat Amazon EMR Notebook adalah Amazon EMR Studio Workspaces di konsol dan konsol Amazon EMR.

Pertimbangkan hal berikut saat merencanakan untuk mengintegrasikan repositori berbasis Git dengan EMR Notebooks.

AWS CodeCommit

Jika Anda menggunakan CodeCommit repositori, Anda harus menggunakan kredensi Git dan HTTPS dengan. CodeCommit Kunci SSH, dan HTTPS dengan pembantu AWS CLI kredensyal tidak didukung. CodeCommit tidak mendukung token akses pribadi (PATs). Untuk informasi selengkapnya, lihat Menggunakan IAM dengan CodeCommit: Kredensyal Git, kunci SSH, dan kunci AWS akses di Panduan Pengguna IAM dan Pengaturan untuk pengguna HTTPS yang menggunakan kredensyal Git di Panduan Pengguna.AWS CodeCommit

Pertimbangan akses dan izin

Sebelum mengasosiasikan repositori dengan notebook Anda, pastikan bahwa klaster Anda, IAM role untuk EMR Notebooks, dan grup keamanan memiliki pengaturan dan izin yang benar. Anda juga dapat mengonfigurasi repositori berbasis Git yang Anda host di jaringan privat dengan mengikuti petunjuk di Mengonfigurasi repositori Git yang di-host secara privat untuk EMR Notebooks.

  • Akses internet klaster — Antarmuka jaringan yang diluncurkan hanya memiliki alamat IP pribadi. Ini berarti bahwa klaster yang menghubungkan notebook Anda harus dalam subnet privat dengan gateway terjemahan alamat jaringan (NAT) atau harus dapat mengakses internet melalui virtual private gateway. Untuk informasi selengkapnya, lihat Opsi Amazon VPC?.

    Grup keamanan untuk notebook Anda harus menyertakan aturan keluar yang memungkinkan notebook untuk mengarahkan lalu lintas ke internet dari klaster. Kami menyarankan agar Anda membuat grup keamanan Anda sendiri. Untuk informasi lebih lanjut, lihat Menentukan grup keamanan EC2 untuk EMR Notebooks.

    penting

    Jika antarmuka jaringan diluncurkan ke subnet publik, antarmuka tersebut tidak akan dapat berkomunikasi dengan internet melalui gateway internet (IGW).

  • Izin untuk AWS Secrets Manager — Jika Anda menggunakan Secrets Manager untuk menyimpan rahasia yang Anda gunakan untuk mengakses repositori, kebijakan izin Peran layanan untuk EMR Notebook harus dilampirkan yang memungkinkan tindakan. secretsmanager:GetSecretValue

Mengonfigurasi repositori Git yang di-host secara privat untuk EMR Notebooks

Gunakan petunjuk berikut untuk mengonfigurasi repositori yang dihost secara privat untuk EMR Notebooks. Anda harus menyediakan file konfigurasi dengan informasi tentang server DNS dan Git Anda. Amazon EMR menggunakan informasi ini untuk mengonfigurasi EMR notebook yang dapat merutekan lalu lintas ke repositori yang Anda host secara privat.

Prasyarat

Sebelum Anda mengonfigurasi repositori Git yang di-host secara privat untuk EMR Notebooks, Anda harus memiliki yang berikut:

  • Amazon S3 Control Lokasi tempat file untuk notebook EMR Anda akan disimpan.

Untuk mengonfigurasi satu atau beberapa repositori Git yang di-host secara privat untuk EMR Notebooks
  1. Buat file konfigurasi menggunakan templat yang disediakan. Sertakan nilai berikut untuk setiap server Git yang ingin Anda tentukan dalam konfigurasi Anda:

    • DnsServerIpV4 - Alamat IPv4 dari server DNS Anda. Jika Anda memberikan nilai untuk DnsServerIpV4 dan GitServerIpV4List, nilai untuk DnsServerIpV4 diutamakan dan akan digunakan untuk menyelesaikan GitServerDnsName Anda.

      catatan

      Untuk menggunakan repositori Git yang di-host secara privat, server DNS Anda harus mengizinkan akses masuk dari EMR Notebooks. Kami sangat menyarankan Anda mengamankan server DNS Anda terhadap akses tidak sah lainnya.

    • GitServerDnsName - Nama DNS server Git Anda. Sebagai contoh "git.example.com".

    • GitServerIpV4List - Daftar alamat IPv4 milik server Git Anda.

    [ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ]
  2. Simpan file konfigurasi Anda sebagai configuration.json.

  3. Unggah file konfigurasi ke lokasi penyimpanan Amazon S3 yang ditunjuk dalam folder bernama life-cycle-configuration. Misalnya, jika lokasi S3 default Anda adalah s3://DOC-EXAMPLE-BUCKET/notebooks, file konfigurasi Anda harus berlokasi di s3://DOC-EXAMPLE-BUCKET/notebooks/life-cycle-configuration/configuration.json.

    penting

    Kami sangat menyarankan agar Anda membatasi akses ke folder life-cycle-configuration untuk hanya administrator EMR Notebooks Anda, dan peran layanan untuk EMR Notebook. Anda juga harus mengamankan configuration.json terhadap akses yang tidak sah. Untuk instruksi, lihat Mengontrol akses ke bucket dengan kebijakan pengguna atau Praktik Terbaik Keamanan untuk Amazon S3.

    Untuk instruksi pengunggahan, lihat Membuat folder dan Pengunggahan objek dalam Panduan Pengguna Amazon Storage Service.