Siapkan data menggunakan Amazon EMR - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Siapkan data menggunakan Amazon EMR

Amazon SageMaker Studio Classic hadir dengan integrasi built-in Amazon EMR, yang dengannya ilmuwan data dan insinyur data dapat melakukan persiapan data interaktif skala petabyte dan pembelajaran mesin (ML) langsung dari notebook Studio Classic mereka. Dalam notebook, mereka dapat menemukan dan terhubung ke cluster EMR Amazon yang ada, kemudian secara interaktif mengeksplorasi, memvisualisasikan, dan menyiapkan data skala besar untuk pembelajaran mesin menggunakan Apache Spark, Apache Hive, Presto. Selain itu, pengguna dapat mengakses Spark UI dengan satu klik untuk memantau pekerjaan Spark mereka dari notebook Studio Classic mereka.

Administrator dapat menggunakan AWS Service Cataloguntuk menentukan AWS CloudFormation templat kluster EMR Amazon yang dapat diakses oleh pengguna Studio Classic. Ilmuwan data kemudian dapat memilih templat yang telah ditentukan untuk menyediakan sendiri cluster EMR Amazon langsung dari notebook Amazon SageMaker Studio Classic. Administrator dapat membuat parameter template lebih lanjut agar pengguna dapat memilih aspek klaster agar sesuai dengan beban kerja mereka dalam nilai yang telah ditentukan. Misalnya, ilmuwan data atau insinyur data mungkin ingin menentukan jumlah node inti cluster hingga nilai maksimum yang telah ditentukan, atau pilih jenis instance node dari menu tarik-turun.