Menggunakan Change Schema untuk memetakan ulang kunci properti data - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan Change Schema untuk memetakan ulang kunci properti data

Transformasi Change Schema memetakan ulang kunci properti data sumber ke dalam konfigurasi yang diinginkan untuk data target. Dalam simpul transformasi Skema Perubahan, Anda dapat:

  • Mengubah nama beberapa kunci properti data.

  • Mengubah tipe data kunci properti data, jika tipe data baru didukung dan ada path transformasi antara dua tipe data.

  • Memilih subset kunci properti data dengan menunjukkan kunci properti data yang ingin Anda buang.

Anda juga dapat menambahkan node Change Schema tambahan ke diagram pekerjaan sesuai kebutuhan — misalnya, untuk memodifikasi sumber data tambahan atau mengikuti transformasi Gabung.

Menggunakan Change Schema dengan tipe data desimal

Saat menggunakan transformasi Change Schema dengan tipe data desimal, transformasi Change Schema memodifikasi presisi ke nilai default (10,2). Untuk memodifikasi ini dan mengatur presisi untuk kasus penggunaan Anda, Anda dapat menggunakan transformasi Kueri SQL dan mentransmisikan kolom dengan presisi tertentu.

Misalnya, jika Anda memiliki kolom input bernama "DecimalCol" dari jenis Desimal, dan Anda ingin memetakannya kembali ke kolom keluaran bernama "OutputDecimalCol" dengan presisi spesifik (18,6), Anda akan:

  1. Tambahkan transformasi Query SQL berikutnya setelah transformasi Change Schema.

  2. Dalam transformasi SQL Query, gunakan kueri SQL untuk mentransmisikan kolom yang dipetakan ulang ke presisi yang diinginkan. Kueri SQL akan terlihat seperti ini:

    SELECT col1, col2, CAST(DecimalCol AS DECIMAL(18,6)) AS OutputDecimalCol FROM __THIS__

    Dalam query SQL di atas:

    • `col1` dan `col2` adalah kolom lain dalam data Anda yang ingin Anda lewati tanpa modifikasi.

    • `DecimalCol` adalah nama kolom asli dari data input.

    • `CAST (DecimalCol AS DECIMAL (18,6)) `melemparkan` DecimalCol `ke tipe Desimal dengan presisi 18 digit dan 6 tempat desimal.

    • `AS OutputDecimalCol `mengganti nama kolom yang dicor menjadi` `. OutputDecimalCol

Dengan menggunakan transformasi SQL Query, Anda dapat mengganti presisi default yang ditetapkan oleh transformasi Change Schema dan secara eksplisit melemparkan kolom Desimal ke presisi yang diinginkan. Pendekatan ini memungkinkan Anda memanfaatkan transformasi Change Schema untuk mengganti nama dan merestrukturisasi data Anda sambil menangani persyaratan presisi untuk kolom Desimal melalui transformasi SQL Query berikutnya.

Menambahkan transformasi Change Schema ke pekerjaan Anda

catatan

Transformasi Change Schema tidak peka huruf besar/kecil.

Untuk menambahkan node transformasi Change Schema ke diagram pekerjaan Anda
  1. (Opsional) Buka panel Resource dan kemudian pilih Change Schema untuk menambahkan transformasi baru ke diagram pekerjaan Anda, jika diperlukan.

  2. Di panel properti node, masukkan nama untuk node dalam diagram pekerjaan. Jika sebuah induk simpul belum dipilih, maka pilihlah sebuah simpul dari daftar Induk simpul untuk digunakan sebagai sumber masukan untuk transformasi tersebut.

  3. Pilih tab Transform di panel properti node.

  4. Memodifikasi skema input:

    • Untuk mengubah nama kunci properti data, masukkan nama baru untuk kunci tersebut di bidang Kunci target.

    • Untuk mengubah tipe data untuk kunci properti data, pilih tipe data baru untuk kunci tersebut dari daftar Jenis data.

    • Untuk menghapus kunci properti data dari skema target, pilih kotak centang Buang untuk kunci itu.

  5. (Opsional) Setelah mengkonfigurasi properti simpul transformasi, Anda dapat melihat skema yang telah diubah untuk data Anda dengan memilih tab Skema output di panel detail simpul. Pertama kali Anda memilih tab ini untuk setiap simpul dalam tugas Anda, Anda akan diminta untuk memberikan IAM role untuk mengakses data. Jika Anda belum menentukan IAM role pada tab Detail tugas, maka Anda akan diminta untuk memasukkan IAM role di sini.

  6. (Opsional) Setelah mengkonfigurasi properti simpul dan properti transformasi, Anda dapat melihat pratinjau set data yang diubah dengan memilih tab Pratinjau data di panel detail simpul. Pertama kali Anda memilih tab ini untuk setiap simpul dalam tugas Anda, Anda akan diminta untuk memberikan IAM role untuk mengakses data. Ada biaya yang terkait dengan penggunaan fitur ini, dan penagihan akan dimulai langsung setelah Anda memberikan IAM role.