FillMissingValues kelas - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

FillMissingValues kelas

Kelas FillMissingValues menempatkan nilai nol dan string kosong dalam sebuah DynamicFrame yang ditentukan dan menggunakan metode machine learning, seperti regresi linier dan hutan acak, untuk memprediksi nilai yang hilang. Tugas ETL menggunakan nilai-nilai dalam set data input untuk melatih model machine learning, yang kemudian memprediksi apa nilai-nilai yang hilang tersebut seharusnya.

Tip

Jika Anda menggunakan kumpulan data tambahan, maka setiap set tambahan digunakan sebagai data pelatihan untuk model machine learning, sehingga hasilnya mungkin tidak akurat.

Untuk mengimpor:

from awsglueml.transforms import FillMissingValues

Metode

apply(frame, missing_values_column, output_column ="", transformation_ctx ="", info ="", stageThreshold = 0, totalThreshold = 0)

Mengisi nilai-nilai yang hilang dari bingkai dinamis dalam kolom yang ditentukan dan mengembalikan bingkai baru dengan perkiraan dalam sebuah kolom baru. Untuk baris tanpa nilai yang hilang, nilai kolom yang ditentukan diduplikasi ke kolom baru tersebut.

  • frameDynamicFrame tempat untuk mengisi nilai yang hilang. Wajib.

  • missing_values_column — Kolom yang berisi nilai-nilai yang hilang (nilai null dan string kosong). Wajib.

  • output_column — Nama kolom baru yang akan berisi perkiraan nilai untuk semua baris yang nilainya hilang. Opsional; default-nya adalah nama missing_values_column dengan sufiks "_filled".

  • transformation_ctx — Sebuah string unik yang digunakan untuk mengidentifikasi informasi status (opsional).

  • info — Sebuah string yang akan dikaitkan dengan kesalahan dalam transformasi (opsional).

  • stageThreshold — Jumlah maksimum kesalahan yang dapat terjadi dalam transformasi sebelum kesalahan keluar (opsional; default-nya adalah nol).

  • totalThreshold — Jumlah maksimum kesalahan yang dapat terjadi secara keseluruhan sebelum kesalahan keluar (opsional; default-nya adalah nol).

Mengembalikan sebuah DynamicFrame baru dengan satu kolom tambahan yang berisi perkiraan untuk baris dengan nilai-nilai yang hilang dan nilai sekarang untuk baris lainnya.