Lowongan Kerja (legacy) - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Lowongan Kerja (legacy)

Skrip berisi kode yang melakukan pekerjaan ekstrak, transformasi, dan load (ETL). Anda dapat memberikan skrip Anda sendiri, atau AWS Glue dapat membuat skrip dengan bimbingan dari Anda. Untuk informasi selengkapnya mengenai cara membuat skrip Anda sendiri, lihat Menyediakan skrip kustom Anda sendiri.

Anda dapat mengedit skrip di konsol AWS Glue. Saat mengedit sebuah skrip, Anda dapat menambahkan sumber, target, dan transformasi.

Untuk mengedit sebuah skrip
  1. Masuk ke AWS Management Console dan buka AWS Glue konsol di https://console.aws.amazon.com/glue/. Lalu pilih tab Tugas.

  2. Pilih tugas dalam daftar, lalu pilih Tindakan, Edit skrip untuk membuka editor skrip.

    Anda juga dapat mengakses editor skrip dari halaman detail tugas. Pilih tab Skrip, lalu pilih Edit skrip.

Editor skrip

Editor skrip AWS Glue memungkinkan Anda memasukkan, memodifikasi, dan menghapus sumber, target, dan transformasi dalam skrip Anda. Editor skrip menampilkan skrip dan diagram untuk membantu Anda memvisualisasikan aliran data.

Untuk membuat diagram untuk skrip tersebut, pilih Buat diagram. AWS Glue menggunakan baris anotasi dalam skrip yang diawali dengan ## untuk membuat diagram. Untuk merepresentasikan skrip Anda dengan benar dalam diagram, Anda harus menyimpan parameter dalam anotasi dan parameter dalam kode Apache Spark secara sinkron.

Editor skrip memungkinkan Anda menambahkan templat kode di mana pun kursor Anda diposisikan dalam skrip. Di bagian atas editor, pilih dari opsi berikut:

  • Untuk menambahkan tabel sumber ke skrip, pilih Sumber.

  • Untuk menambahkan tabel target ke skrip, pilih Target.

  • Untuk menambahkan lokasi target ke skrip, pilih Lokasi target.

  • Untuk menambahkan transformasi ke skrip, pilih Transformasi. Untuk informasi tentang fungsi yang dipanggil dalam skrip Anda, lihat Program skrip AWS Glue ETL di PySpark.

  • Untuk menambahkan transformasi Spigot ke skrip, pilih Spigot.

Dalam kode yang dimasukkan, ubah parameters yang ada di anotasi dan kode Apache Spark. Sebagai contoh, jika Anda menambahkan transformasi Spigot, maka Anda harus memverifikasi bahwa path sudah diganti, baik di baris anotasi @args dan baris kode output.

Tab Log menunjukkan log yang dikaitkan dengan tugas Anda saat ia berjalan. 1.000 baris terbaru ditampilkan.

Tab Skema menunjukkan skema sumber dan target yang dipilih, bila ada dalam Katalog Data.