Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

Menggunakan tabel Katalog Data untuk sumber data

Mode fokus
Menggunakan tabel Katalog Data untuk sumber data - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Untuk semua sumber data kecuali Amazon S3 dan konektor, tabel harus ada di AWS Glue Data Catalog untuk jenis sumber yang Anda pilih. AWS Glue tidak membuat tabel Katalog Data.

Untuk mengkonfigurasi simpul sumber data berdasarkan tabel Katalog Data
  1. Pergi ke editor visual untuk sebuah tugas baru atau yang sudah disimpan.

  2. Pilih simpul sumber data dalam diagram tugas.

  3. Pilih tab Properti sumber data, dan kemudian masukkan informasi berikut:

    • Jenis sumber S3: (Hanya untuk sumber data Amazon S3) Pilih opsi Pilih tabel Katalog untuk menggunakan yang sudah ada AWS Glue Data Catalog meja.

    • Basis data: Pilih basis data dalam Katalog Data yang berisi tabel sumber yang ingin Anda gunakan untuk tugas ini. Anda dapat menggunakan bidang pencarian untuk mencari basis data berdasarkan namanya.

    • Tabel: Pilih tabel yang telah dikaitkan dengan sumber data dari daftar. Tabel ini harus sudah ada diAWS Glue Data Catalog. Anda dapat menggunakan kolom pencarian untuk mencari tabel dengan namanya.

    • Predikat partisi: (Untuk sumber data Amazon S3 saja) Masukkan ekspresi Boolean berdasarkan Spark SQL yang hanya mencakup kolom pemartisian. Misalnya: "(year=='2020' and month=='04')"

    • Direktori sementara: (Untuk sumber data Amazon Redshift saja) Masukkan path untuk lokasi direktori kerja di Amazon S3 di mana tugas ETL Anda dapat menulis hasil antara sementara.

    • Peran yang dikaitkan dengan klaster: (Untuk sumber data Amazon Redshift saja) Masukkan sebuah peran untuk tugas ETL Anda untuk menggunakan yang berisi izin untuk klaster Amazon Redshift . Untuk informasi selengkapnya, lihat Izin sumber data dan target data.

PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.