Melihat statistik kolom - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Melihat statistik kolom

Setelah berhasil menghasilkan statistik, Data Catalog menyimpan informasi ini untuk pengoptimal berbasis biaya di dan Amazon Amazon Athena Redshift untuk membuat pilihan optimal saat menjalankan kueri. Statistik bervariasi berdasarkan jenis kolom.

AWS Management Console
Untuk melihat statistik kolom untuk tabel
  • Setelah menjalankan tugas statistik kolom, tab Statistik kolom pada halaman Rincian tabel menunjukkan statistik untuk tabel.

    Tangkapan layar menunjukkan kolom yang dihasilkan dari proses terbaru.

    Statistik berikut tersedia:

    • Nama kolom: Nama kolom yang digunakan untuk menghasilkan statistik

    • Terakhir diperbarui: Data dan waktu ketika statistik dihasilkan

    • Panjang rata-rata: Panjang rata-rata nilai di kolom

    • Nilai yang berbeda: Jumlah nilai yang berbeda dalam kolom. Kami memperkirakan jumlah nilai yang berbeda dalam kolom dengan kesalahan relatif 5%.

    • Nilai maksimum: Nilai terbesar dalam kolom.

    • Nilai min: Nilai terkecil dalam kolom.

    • Panjang maks: Panjang nilai tertinggi dalam kolom.

    • Nilai nol: Jumlah total nilai nol dalam kolom.

    • Nilai yang sebenarnya: Jumlah nilai yang sebenarnya dalam kolom.

    • Nilai SALAH: Jumlah nilai SALAH dalam kolom.

AWS CLI

Contoh berikut menunjukkan cara mengambil statistik kolom. AWS CLI

aws glue get-column-statistics-for-table \ --database-name <test_db> \ --table-name <test_tble> \ --column-names <col1>

Anda juga dapat melihat statistik kolom menggunakan operasi GetColumnStatisticsForTableAPI.