Amazon EMR Studio - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Amazon EMR Studio

Amazon EMR Studio adalah lingkungan pengembangan terintegrasi berbasis web (IDE) untuk notebook Jupyter yang dikelola sepenuhnya yang berjalan di kluster EMR Amazon. Anda dapat menyiapkan EMR Studio untuk tim Anda untuk mengembangkan, memvisualisasikan, dan men-debug aplikasi yang ditulis dalam R, Python, Scala, dan. PySpark EMR Studio terintegrasi dengan AWS Identity and Access Management (IAM) dan IAM Identity Center sehingga pengguna dapat masuk menggunakan kredensyal perusahaan mereka.

Anda dapat membuat EMR Studio tanpa biaya. Berlaku biaya untuk penyimpanan Amazon S3 dan untuk klaster Amazon EMR berlaku ketika Anda menggunakan EMR Studio. Untuk detail dan sorotan produk, lihat halaman layanan untuk Amazon EMR Studio.

Fitur utama dari EMR Studio

Amazon EMR Studio menyediakan fitur-fitur berikut:

  • Mengautentikasi pengguna dengan AWS Identity and Access Management (IAM), atau AWS IAM Identity Center dengan atau tanpa propagasi identitas tepercaya dan penyedia identitas perusahaan Anda.

  • Akses dan luncurkan klaster EMR Amazon sesuai permintaan untuk menjalankan pekerjaan Jupyter Notebook.

  • Connect ke Amazon EMR di kluster EKS untuk mengirimkan pekerjaan saat pekerjaan berjalan.

  • Jelajahi dan simpan contoh notebook. Untuk informasi selengkapnya tentang contoh buku catatan, lihat repositori contoh Notebook GitHub EMR Studio.

  • Analisis data menggunakan Python,, Spark PySpark Scala, Spark R, atau SparkSQL, dan instal kernel dan pustaka khusus.

  • Berkolaborasi secara real time dengan pengguna lain di Workspace yang sama. Untuk informasi selengkapnya, lihat Konfigurasikan kolaborasi Workspace.

  • Gunakan EMR Studio SQL Explorer untuk menelusuri katalog data Anda, menjalankan kueri SQL, dan mengunduh hasil sebelum Anda bekerja dengan data di buku catatan.

  • Jalankan notebook berparameter sebagai bagian dari alur kerja terjadwal dengan alat orkestrasi seperti Apache Airflow atau Amazon Managed Workflows for Apache Airflow. Untuk informasi selengkapnya, lihat Orchestrating analytics jobs on EMR Notebooks using MWAA dalam Blog Big Data AWS.

  • Tautkan repositori kode seperti GitHub dan. BitBucket

  • Melacak dan men-debug pekerjaan menggunakan Spark History Server, Tez UI, atau server timeline YARN.

EMR Studio juga memenuhi syarat HIPAA dan disertifikasi di bawah HITRUST CSF dan SOC 2. Untuk informasi selengkapnya tentang kepatuhan HIPAA untuk AWS layanan, lihathttps://aws.amazon.com/compliance/hipaa-compliance/. Untuk mempelajari lebih lanjut tentang kepatuhan CSF HITRUST untuk AWS layanan, lihat. https://aws.amazon.com/compliance/hitrust/ Untuk informasi selengkapnya tentang program kepatuhan lainnya untuk AWS layanan, lihat AWSLayanan dalam Lingkup menurut Program Kepatuhan.

Riwayat fitur Amazon EMR Studio

Tabel ini mencantumkan pembaruan untuk kemampuan penskalaan terkelola Amazon EMR.

Tanggal rilis Kemampuan
November 26, 2023

Menambahkan dukungan untuk propagasi identitas tepercaya untuk EMR Studio dengan autentikasi IAM Identity Center.

Oktober 26, 2023

Ditambahkan kemampuan untuk membuat aplikasi EMR Serverless dengan kemampuan interaktif.

Februari 28, 2023

Menambahkan dukungan kunci AWS KMS yang dikelola pelanggan untuk penyimpanan log aplikasi untuk aplikasi EMR Tanpa Server.

Februari 23, 2023

Menambahkan pembuatan peran IAM satu klik untuk pengiriman pekerjaan EMR Tanpa Server. Menambahkan pencarian ECR saat Anda memilih gambar khusus untuk aplikasi EMR Tanpa Server.

Januari 27, 2023

Notebook eksekusi tanpa kepala dapat melacak kemajuan setiap eksekusi sel dengan %execute_notebook sihir.

Januari 23, 2023

Aplikasi persisten telah dioptimalkan untuk waktu peluncuran yang lebih cepat.