Buat lingkungan Amazon MWAA - Amazon Managed Workflows for Apache Airflow (MWAA)

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat lingkungan Amazon MWAA

Alur Kerja Terkelola Amazon untuk Apache Airflow menyiapkan Apache Airflow di lingkungan dalam versi pilihan Anda menggunakan Apache Airflow sumber terbuka yang sama dan antarmuka pengguna yang tersedia dari Apache. Panduan ini menjelaskan langkah-langkah untuk membuat lingkungan Amazon MWAA.

Sebelum Anda mulai

  • Jaringan VPC yang Anda tentukan untuk lingkungan Anda tidak dapat dimodifikasi setelah lingkungan dibuat.

  • Anda memerlukan bucket Amazon S3 yang dikonfigurasi untuk Memblokir semua akses publik, dengan Versi Bucket diaktifkan.

  • Anda memerlukan AWS akun dengan izin untuk menggunakan Amazon MWAA, dan izin di AWS Identity and Access Management (IAM) untuk membuat peran IAM. Jika Anda memilih mode akses jaringan pribadi untuk server web Apache Airflow, yang membatasi akses Apache Airflow dalam VPC Amazon Anda, Anda memerlukan izin di IAM untuk membuat titik akhir Amazon VPC.

Versi Apache Airflow

Versi Apache Airflow berikut didukung di Alur Kerja Terkelola Amazon untuk Apache Airflow.

catatan
  • Dimulai dengan Apache Airflow v2.2.2, Amazon MWAA mendukung penginstalan persyaratan Python, paket penyedia, dan plugin khusus langsung di server web Apache Airflow.

  • Dimulai dengan Apache Airflow v2.7.2, file persyaratan Anda harus menyertakan pernyataan. --constraint Jika Anda tidak memberikan kendala, Amazon MWAA akan menentukan satu untuk Anda untuk memastikan paket yang tercantum dalam persyaratan Anda kompatibel dengan versi Apache Airflow yang Anda gunakan.

    Untuk informasi selengkapnya tentang pengaturan batasan dalam file persyaratan Anda, lihat Menginstal dependensi Python.

Untuk informasi selengkapnya tentang memigrasi penerapan Apache Airflow yang dikelola sendiri, atau memigrasikan lingkungan Amazon MWAA yang ada, termasuk petunjuk untuk mencadangkan database metadata Anda, lihat Panduan Migrasi Amazon MWAA.

Buat lingkungan

Bagian berikut menjelaskan langkah-langkah untuk membuat lingkungan Amazon MWAA.

Langkah satu: Tentukan detail

Untuk menentukan detail untuk lingkungan
  1. Buka konsol Amazon MWAA.

  2. Gunakan pemilih AWS Wilayah untuk memilih wilayah Anda.

  3. Pilih Buat lingkungan.

  4. Pada halaman Tentukan detail, di bawah Detail lingkungan:

    1. Ketik nama unik untuk lingkungan Anda di Nama.

    2. Pilih versi Apache Airflow dalam versi Airflow.

      catatan

      Jika tidak ada nilai yang ditentukan, default ke versi Airflow terbaru. Versi terbaru yang tersedia adalah Apache Airflow v2.8.1.

  5. Di bawah kode DAG di Amazon S3 tentukan yang berikut:

    1. Ember S3. Pilih Jelajahi S3 dan pilih bucket Amazon S3 Anda, atau masukkan URI Amazon S3.

    2. Folder DAGs. Pilih Jelajahi S3 dan pilih dags folder di bucket Amazon S3 Anda, atau masukkan URI Amazon S3.

    3. File plugin - opsional. Pilih Jelajahi S3 dan pilih plugins.zip file di bucket Amazon S3 Anda, atau masukkan URI Amazon S3.

    4. File persyaratan - opsional. Pilih Jelajahi S3 dan pilih requirements.txt file di bucket Amazon S3 Anda, atau masukkan URI Amazon S3.

    5. File skrip startup - opsional, Pilih Browse S3 dan pilih file skrip di bucket Amazon S3 Anda, atau masukkan URI Amazon S3.

  6. Pilih Selanjutnya.

Langkah kedua: Konfigurasikan pengaturan lanjutan

Untuk mengonfigurasi pengaturan lanjutan
  1. Pada halaman Konfigurasi pengaturan lanjutan, di bawah Jaringan:

    1. Pilih Amazon VPC Anda.

      Langkah ini mengisi dua subnet pribadi di VPC Amazon Anda.

  2. Di bawah akses server Web, pilih mode akses Apache Airflow pilihan Anda:

    1. Jaringan pribadi. Ini membatasi akses Apache Airflow UI ke pengguna dalam VPC Amazon Anda yang telah diberikan akses ke kebijakan IAM untuk lingkungan Anda. Anda memerlukan izin untuk membuat titik akhir Amazon VPC untuk langkah ini.

      catatan

      Pilih opsi Jaringan pribadi jika UI Apache Airflow Anda hanya diakses dalam jaringan perusahaan, dan Anda tidak memerlukan akses ke repositori publik untuk instalasi persyaratan server web. Jika Anda memilih opsi mode akses ini, Anda perlu membuat mekanisme untuk mengakses server Web Apache Airflow Anda di VPC Amazon Anda. Untuk informasi selengkapnya, lihat Mengakses titik akhir VPC untuk server Web Apache Airflow Anda (akses jaringan pribadi).

    2. Jaringan publik. Hal ini memungkinkan Apache Airflow UI untuk diakses melalui Internet oleh pengguna yang diberikan akses ke kebijakan IAM untuk lingkungan Anda.

  3. Di bawah Grup keamanan, pilih grup keamanan yang digunakan untuk mengamankan VPC Amazon Anda:

    1. Secara default, Amazon MWAA membuat grup keamanan di VPC Amazon Anda dengan aturan masuk dan keluar tertentu di Buat grup keamanan baru.

    2. Opsional. Hapus centang kotak di Buat grup keamanan baru untuk memilih hingga 5 grup keamanan.

      catatan

      Grup keamanan Amazon VPC yang ada harus dikonfigurasi dengan aturan masuk dan keluar tertentu untuk memungkinkan lalu lintas jaringan. Untuk mempelajari selengkapnya, lihat Keamanan di VPC Anda di Amazon MWAA.

  4. Di bawah kelas Lingkungan, pilih kelas lingkungan.

    Sebaiknya pilih ukuran terkecil yang diperlukan untuk mendukung beban kerja Anda. Anda dapat mengubah kelas lingkungan kapan saja.

  5. Untuk jumlah pekerja maksimum, tentukan jumlah maksimum pekerja Apache Airflow untuk dijalankan di lingkungan.

    Untuk informasi selengkapnya, lihat Contoh kasus penggunaan kinerja tinggi.

  6. Tentukan jumlah server web maksimum dan Jumlah server web minimum untuk mengonfigurasi cara Amazon MWAA menskalakan server web Apache Airflow di lingkungan Anda.

    Untuk informasi selengkapnya tentang penskalaan otomatis server web, lihatMengkonfigurasi penskalaan otomatis server web Amazon MWAA.

  7. Di bawah Enkripsi, pilih opsi enkripsi data:

    1. Secara default, Amazon MWAA menggunakan kunci yang AWS dimiliki untuk mengenkripsi data Anda.

    2. Opsional. Pilih Sesuaikan pengaturan enkripsi (lanjutan) untuk memilih AWS KMS kunci yang berbeda. Jika Anda memilih untuk menentukan kunci yang dikelola Pelanggan dalam langkah ini, Anda harus menentukan ID AWS KMS kunci atau ARN. AWS KMS alias dan kunci multi-wilayah tidak didukung oleh Amazon MWAA. Jika Anda menentukan kunci Amazon S3 untuk enkripsi sisi server di bucket Amazon S3, Anda harus menentukan kunci yang sama untuk lingkungan Amazon MWAA Anda.

      catatan

      Anda harus memiliki izin untuk kunci untuk memilihnya di konsol Amazon MWAA. Anda juga harus memberikan izin kepada Amazon MWAA untuk menggunakan kunci dengan melampirkan kebijakan yang dijelaskan di. Lampirkan kebijakan kunci

  8. Direkomendasikan. Di bawah Monitoring, pilih satu atau beberapa kategori log untuk konfigurasi pencatatan Aliran Udara untuk mengirim log Apache Airflow ke Log: CloudWatch

    1. Log tugas aliran udara. Pilih jenis log tugas Apache Airflow untuk dikirim ke tingkat CloudWatch Log di Log.

    2. Log server web aliran udara. Pilih jenis log server web Apache Airflow untuk dikirim ke tingkat CloudWatch Log di Log.

    3. Log penjadwal aliran udara. Pilih jenis log penjadwal Apache Airflow untuk dikirim ke tingkat Log di CloudWatch Log.

    4. Log pekerja aliran udara. Pilih jenis log pekerja Apache Airflow untuk dikirim ke tingkat CloudWatch Log di Log.

    5. Log pemrosesan DAG aliran udara. Pilih jenis log pemrosesan Apache Airflow DAG untuk dikirim ke tingkat CloudWatch Log di Log.

  9. Opsional. Untuk opsi konfigurasi Aliran Udara, pilih opsi Tambahkan konfigurasi khusus.

    Anda dapat memilih dari daftar dropdown yang disarankan dari opsi konfigurasi Apache Airflow untuk versi Apache Airflow Anda, atau menentukan opsi konfigurasi khusus. Misalnya,core.default_task_retries:3.

  10. Opsional. Di bawah Tag, pilih Tambahkan tag baru untuk mengaitkan tag ke lingkungan Anda. Misalnya,Environment:Staging.

  11. Di bawah Izin, pilih peran eksekusi:

    1. Secara default, Amazon MWAA membuat peran eksekusi di Buat peran baru. Anda harus memiliki izin untuk membuat peran IAM untuk menggunakan opsi ini.

    2. Opsional. Pilih Masukkan peran ARN untuk memasukkan Nama Sumber Daya Amazon (ARN) dari peran eksekusi yang ada.

  12. Pilih Selanjutnya.

Langkah ketiga: Tinjau dan buat

Untuk meninjau ringkasan lingkungan
  • Tinjau ringkasan lingkungan, pilih Buat lingkungan.

    catatan

    Dibutuhkan sekitar dua puluh hingga tiga puluh menit untuk menciptakan lingkungan.