Aurora Postgre SQL -Integrasi yang kompatibel dengan AWS Glue - AWS Panduan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Aurora Postgre SQL -Integrasi yang kompatibel dengan AWS Glue

AWS Glue adalah layanan ekstrak, transformasi, dan beban (ETL) yang dikelola sepenuhnya untuk menyiapkan dan memuat data untuk analitik. Anda dapat berintegrasi AWS Glue dengan Amazon Aurora Postgre SQL -Compatible Edition untuk setiap alur kerja pemrosesan data dan analitik.

AWS Glue kasus penggunaan dan langkah-langkah tingkat tinggi

Integrasi Aurora Postgre SQL -Kompatibel dengan AWS Glue mendukung kasus penggunaan berikut:

  • Pergudangan dan analitik data - Gunakan AWS Glue integrasi dengan Aurora SQL Postgre -Kompatibel untuk membangun pergudangan data dan solusi analitik. AWS Glue dapat mengekstrak data dari Aurora Postgre SQL -Basis data yang kompatibel, dan mengubahnya sesuai dengan kebutuhan Anda. Kemudian AWS Glue dapat memuat data yang diubah ke dalam gudang data seperti Amazon Redshift atau Amazon Athena untuk analitik dan pelaporan lanjutan.

  • Pembuatan danau data - Gunakan AWS Glue untuk mengekstrak data dari Aurora Postgre SQL -Kompatibel dan memuatnya ke danau data yang disimpan di Amazon S3. Anda kemudian dapat menggunakan data lake ini untuk berbagai tujuan, seperti pembelajaran mesin, eksplorasi data, atau memberi makan sistem analitik lainnya.

  • ETLpipelines - Gunakan ETL layanan AWS Glue tanpa server untuk membangun pipeline data yang kuat. Anda dapat mengekstrak data dari Aurora Postgre SQL -Compatible, dan melakukan transformasi kompleks dengan menggunakan Apache Spark atau. PySpark Anda dapat memuat data yang diproses ke target seperti Amazon S3 atau Amazon Redshift, atau Anda dapat memuatnya kembali ke Aurora Postgre -Compatible. SQL

  • Katalogisasi data dan manajemen metadata - Gunakan AWS Glue Data Catalog untuk merayapi dan membuat katalog metadata secara otomatis dari Aurora Postgre -Basis data dan tabel yang kompatibel. SQL Layanan AWS seperti Amazon Athena dan Amazon Redshift Spectrum dapat menggunakan repositori metadata terpusat ini untuk menanyakan dan menganalisis data.

  • Persiapan data untuk pembelajaran mesin - Gunakan AWS Glue untuk menyiapkan data dari Aurora Postgre SQL -Kompatibel untuk beban kerja pembelajaran mesin (ML). Data yang diproses dapat dimuat ke Amazon SageMaker AI atau layanan ML lainnya untuk pelatihan dan penerapan model.

  • Migrasi dan replikasi data - Sementara AWS Database Migration Service (AWS DMS) adalah layanan utama untuk migrasi database, Anda juga dapat menggunakan. AWS Glue Migrasi atau replikasi data dari Aurora Postgre SQL -Kompatibel dengan penyimpanan data lain, seperti Amazon S3, Amazon Redshift, atau bahkan mesin database lainnya.

Organisasi Anda dapat menggunakan kekuatan integrasi AWS data dan layanan analitik dengan skalabilitas, kinerja, dan kompatibilitas Aurora SQL Postgre -Compatible. Dengan kasus penggunaan ini, Anda dapat membangun jalur data yang kuat, melakukan transformasi data yang kompleks, dan berintegrasi dengan yang lain Layanan AWS untuk analitik dan pelaporan lanjutan.

Untuk mengintegrasikan Aurora Postgre SQL -Kompatibel dengan AWS Glue, gunakan langkah-langkah tingkat tinggi berikut:

  1. Masuk ke AWS Management Console, navigasikan ke AWS Glue konsol, dan buat file AWS Glue Data Catalog.

    Katalog Data adalah repositori pusat yang menyimpan metadata tentang sumber data Anda, termasuk Aurora Postgre -Basis data dan tabel yang kompatibel. SQL

  2. Buat AWS Glue koneksi.

    Arahkan ke halaman Koneksi, dan buat AWS Glue koneksi. Pilih Aurora Postgre SQL -Compatible sebagai jenis koneksi, dan berikan Aurora Postgre SQL -Compatible cluster endpoint, nama database, dan nama pengguna dan kata sandi database Anda.

  3. Merayapi Aurora SQL Postgre -Sumber data yang kompatibel.

    Arahkan ke bagian Crawler, dan buat crawler yang dikonfigurasi untuk menggunakan koneksi yang Anda buat. Tentukan nama database dan tabel yang ingin dirayapi dan disertakan dalam Katalog Data, dan jalankan crawler.

  4. Buat dan jalankan AWS Glue ETL pekerjaan.

    Arahkan ke bagian Pekerjaan, dan buat ETL pekerjaan untuk mengakses dan menanyakan data dari database Aurora Postgre SQL -Compatible dengan menggunakan Katalog Data. Pilih jenis pekerjaan berdasarkan kebutuhan Anda. Dalam skrip ETL pekerjaan, lakukan transformasi atau pemrosesan yang diperlukan, dan tentukan lokasi target untuk data yang diproses. Lokasi target dapat berupa Amazon S3, Amazon Redshift, atau database Aurora Postgre -Compatible lainnya. SQL

Untuk petunjuk rinci, lihat AWS Glue dokumentasi.