Apa Alur Kerja yang Dikelola Amazon untuk Apache Airflow? - Amazon Managed Workflows for Apache Airflow (MWAA)

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apa Alur Kerja yang Dikelola Amazon untuk Apache Airflow?

Gunakan Alur Kerja Terkelola Amazon untuk Apache Airflow, layanan orkestrasi terkelola untuk Apache Airflow, untuk menyiapkan dan mengoperasikan pipeline data di cloud dalam skala besar. Apache Airflow adalah alat sumber terbuka yang digunakan untuk secara terprogram membuat, menjadwalkan, dan memantau urutan proses dan tugas yang disebut sebagai alur kerja.

Dengan Amazon MWAA, Anda dapat menggunakan Apache Airflow dan Python untuk membuat alur kerja tanpa harus mengelola infrastruktur yang mendasarinya untuk skalabilitas, ketersediaan, dan keamanan. Amazon MWAA secara otomatis menskalakan kapasitas eksekusi alur kerjanya untuk memenuhi kebutuhan Anda, dan terintegrasi dengan layanan AWS keamanan untuk membantu memberi Anda akses cepat dan aman ke data Anda.

Fitur

Tinjau fitur-fitur berikut untuk mempelajari bagaimana Amazon MWAA dapat menyederhanakan pengelolaan alur kerja Apache Airflow Anda.

Arsitektur

Semua komponen yang terdapat di kotak luar (pada gambar di bawah) muncul sebagai lingkungan MWAA Amazon tunggal di akun Anda. Penjadwal dan Pekerja Apache Airflow AWS Fargate adalah wadah yang terhubung ke subnet pribadi di VPC Amazon untuk lingkungan Anda. Setiap lingkungan memiliki metadatabase Apache Airflow sendiri yang dikelola AWS oleh yang dapat diakses oleh kontainer Scheduler dan Workers Fargate melalui titik akhir VPC yang diamankan secara pribadi.

Amazon CloudWatch, Amazon S3, Amazon SQS, AWS KMS dan terpisah dari Amazon MWAA dan harus dapat diakses dari Penjadwal Aliran Udara Apache dan Pekerja di wadah Fargate.

Server Web Apache Airflow dapat diakses baik melalui Internet dengan memilih mode akses Apache Airflow jaringan Publik, atau dalam VPC Anda dengan memilih mode akses Apache Airflow jaringan Pribadi. Dalam kedua kasus tersebut, akses untuk pengguna Apache Airflow Anda dikontrol oleh kebijakan kontrol akses yang Anda tentukan AWS Identity and Access Management (IAM).

catatan

Beberapa Penjadwal Aliran Udara Apache hanya tersedia dengan Apache Airflow v2 dan di atasnya. Pelajari lebih lanjut tentang siklus hidup tugas Apache Airflow di Concepts dalam panduan referensi Apache Airflow.

Gambar ini menunjukkan arsitektur lingkungan Amazon MWAA.

Integrasi

Komunitas open-source Apache Airflow yang aktif dan berkembang menyediakan operator (plugin yang menyederhanakan koneksi ke layanan) untuk Apache Airflow untuk diintegrasikan dengan layanan. AWS Ini termasuk layanan seperti Amazon S3, Amazon Redshift, Amazon AWS Batch EMR, SageMaker dan Amazon AI, serta layanan di platform cloud lainnya.

Menggunakan Apache Airflow dengan Amazon MWAA sepenuhnya mendukung AWS integrasi dengan layanan dan alat pihak ketiga yang populer seperti Apache Hadoop, Presto, Hive, dan Spark untuk melakukan tugas pemrosesan data. Amazon MWAA berkomitmen untuk menjaga kompatibilitas dengan Apache Airflow API, dan Amazon MWAA bermaksud untuk menyediakan AWS integrasi yang andal ke layanan dan membuatnya tersedia bagi komunitas, dan terlibat dalam pengembangan fitur komunitas.

Untuk kode sampel, lihatContoh kode untuk Alur Kerja Terkelola Amazon untuk Apache Airflow.

Versi yang didukung

Amazon MWAA mendukung beberapa versi Apache Airflow. Untuk informasi lebih lanjut tentang versi Apache Airflow yang kami dukung dan komponen Apache Airflow yang disertakan dengan setiap versi, lihat. Versi Apache Airflow di Amazon Managed Workflow untuk Apache Airflow

Apa selanjutnya?