Menghasilkan statistik kolom - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menghasilkan statistik kolom

Ikuti langkah-langkah ini untuk mengelola pembuatan statistik di Katalog Data menggunakan AWS Glue konsol atau AWS CLI.

Console
Untuk menghasilkan statistik kolom menggunakan konsol
  1. Masuk ke AWS Glue konsol di https://console.aws.amazon.com/glue/.

  2. Pilih tabel Katalog Data.

  3. Pilih tabel dari daftar.

  4. Pilih Statistik kolom, Hasilkan sesuai permintaan, di bawah menu Tindakan.

    Anda juga dapat memilih tombol Hasilkan statistik di bawah tab Statistik kolom di bagian bawah halaman Tabel.

  5. Pada halaman Hasilkan statistik, tentukan opsi berikut:

    Tangkapan layar menunjukkan opsi yang tersedia untuk menghasilkan statistik kolom.
    • Tabel (semua kolom) - Pilih opsi ini untuk menghasilkan statistik untuk semua kolom dalam tabel.

    • Kolom yang dipilih - Pilih opsi ini untuk menghasilkan statistik untuk kolom tertentu. Anda dapat memilih kolom dari daftar drop-down.

    • Semua baris - Pilih semua baris dari tabel untuk menghasilkan statistik yang akurat.

    • Baris sampel - Pilih hanya persentase baris tertentu dari tabel untuk menghasilkan statistik. Defaultnya adalah semua baris. Gunakan panah atas dan bawah untuk menambah atau mengurangi nilai persen.

      catatan

      Kami merekomendasikan untuk memasukkan semua baris dalam tabel untuk menghitung statistik yang akurat. Gunakan baris sampel untuk menghasilkan statistik kolom hanya jika nilai perkiraan dapat diterima.

  6. (Opsional) Selanjutnya, pilih konfigurasi keamanan untuk mengaktifkan enkripsi saat istirahat untuk log.

  7. Pilih Hasilkan statistik untuk menjalankan tugas.

AWS CLI

Dalam contoh berikut, ganti nilai untukDatabaseName,TableName, dan ColumnNameList dengan database aktual, tabel, dan nama kolom. Ganti ID akun dengan nama peran yang valid Akun AWS dan nama peran dengan nama peran IAM yang Anda gunakan untuk menghasilkan statistik.

aws glue start-column-statistics-task-run --input-cli-json file://input.json { "DatabaseName": "<test-db>", "TableName": "<test-table>", "ColumnNameList": [ "<column1>", "<column2>", ], "Role": "arn:aws:iam::<123456789012>:role/<Stats-Role>", "SampleSize": 10.0 }

Anda dapat menghasilkan statistik kolom juga dengan memanggil StartColumnStatisticsTaskRunoperasi.