Menggunakan transformasi Record Matching untuk menjalankan transformasi klasifikasi data yang ada - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan transformasi Record Matching untuk menjalankan transformasi klasifikasi data yang ada

Transformasi ini memanggil transformasi klasifikasi data pembelajaran mesin Record Matching yang ada.

Transformasi mengevaluasi data saat ini terhadap model terlatih berdasarkan label. Kolom “match_id” ditambahkan untuk menetapkan setiap baris ke sekelompok item yang dianggap setara berdasarkan pelatihan algoritma. Untuk informasi lebih lanjut, lihat Rekam pencocokan dengan Lake Formation FindMatches.

catatan

Versi yang AWS Glue digunakan oleh pekerjaan visual harus cocok dengan versi yang AWS Glue digunakan untuk membuat transformasi Record Matching.

Tangkapan layar menunjukkan pratinjau data untuk transformasi.
Untuk menambahkan node transformasi Record Matching ke diagram pekerjaan Anda
  1. Buka panel Resource, lalu pilih Record Matching untuk menambahkan transformasi baru ke diagram pekerjaan Anda. Node yang dipilih pada saat menambahkan node akan menjadi induknya.

  2. Di panel properti node, Anda dapat memasukkan nama untuk node dalam diagram pekerjaan. Jika sebuah induk simpul belum dipilih, maka pilihlah sebuah simpul dari daftar Induk simpul untuk digunakan sebagai sumber masukan untuk transformasi tersebut.

  3. Pada tab Transform, masukkan ID yang diambil dari halaman Transformasi pembelajaran mesin:

    Tangkapan layar menunjukkan ID dari halaman Transformasi pembelajaran mesin.
  4. (Opsional) Pada Transform tab, Anda dapat mencentang opsi untuk menambahkan skor kepercayaan. Dengan biaya komputasi ekstra, model akan memperkirakan skor kepercayaan untuk setiap pertandingan sebagai kolom tambahan.