Sumber daya aplikasi - Layanan Terkelola untuk Apache Flink

Amazon Managed Service untuk Apache Flink sebelumnya dikenal sebagai Amazon Kinesis Data Analytics untuk Apache Flink.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Sumber daya aplikasi

Bagian ini menjelaskan sumber daya sistem yang digunakan aplikasi Anda. Memahami bagaimana Layanan Terkelola untuk penyediaan dan penggunaan sumber daya Apache Flink akan membantu Anda merancang, membuat, dan mempertahankan Layanan Terkelola yang berkinerja dan stabil untuk aplikasi Apache Flink.

Layanan Terkelola untuk sumber daya aplikasi Apache Flink

Managed Service for Apache Flink adalah AWS layanan yang menciptakan lingkungan untuk hosting aplikasi Apache Flink Anda. Layanan Managed Service for Apache Flink menyediakan sumber daya menggunakan unit yang disebut Kinesis Processing Unit (KPU).

Satu KPU mewakili sumber daya sistem berikut:

  • Satu inti CPU

  • 4 GB memori, dengan satu GB adalah memori asli dan tiga GB adalah memori timbunan

  • 50 GB ruang disk

KPU menjalankan aplikasi dalam unit eksekusi berbeda yang disebut tugas dan subtugas. Anda bisa menganggap subtugas seperti utas.

Jumlah KPU yang tersedia untuk aplikasi sama dengan pengaturan Parallelism aplikasi, dibagi dengan pengaturan ParallelismPerKPU aplikasi.

Untuk informasi selengkapnya tentang paralelisme aplikasi, lihat Penskalaan.

Lingkungan Apache Flink mengalokasikan sumber daya untuk aplikasi Anda menggunakan unit yang disebut slot tugas. Ketika Managed Service untuk Apache Flink mengalokasikan sumber daya untuk aplikasi Anda, ia menetapkan satu atau lebih slot tugas Apache Flink ke satu KPU. Jumlah slot yang ditetapkan ke satu KPU sama dengan pengaturan ParallelismPerKPU aplikasi Anda. Untuk informasi selengkapnya tentang slot tugas, lihat Penjadwalan Pekerjaan di Dokumentasi Apache Flink.

Anda dapat mengatur jumlah maksimum subtugas yang dapat digunakan operator. Nilai ini disebut Paralelisme Operator. Secara default, paralelisme dari setiap operator dalam aplikasi Anda adalah sama dengan paralelisme aplikasi. Artinya, setiap operator dalam aplikasi Anda secara default dapat menggunakan semua subtugas yang tersedia dalam aplikasi jika diperlukan.

Anda dapat mengatur paralelisme operator dalam aplikasi Anda menggunakan metode setParallelism. Dengan menggunakan metode ini, Anda dapat mengontrol jumlah subtugas yang dapat digunakan setiap operator pada satu waktu.

Untuk informasi selengkapnya tentang operator, lihat Operator di Dokumentasi Apache Flink.

Biasanya, setiap operator menggunakan subtugas terpisah untuk mengeksekusi, tetapi jika beberapa operator selalu mengeksekusi secara berurutan, runtime dapat menetapkannya ke tugas yang sama. Proses ini disebut Rantai Operator.

Beberapa operator berurutan dapat dirantai menjadi satu tugas jika semuanya beroperasi pada data yang sama. Berikut adalah beberapa kriteria yang diperlukan agar hal ini benar:

  • Operator melakukan penerusan sederhana 1 ke 1.

  • Operator semuanya memiliki paralelisme operator yang sama.

Ketika aplikasi Anda merantai operator menjadi satu subtugas, hal ini menghemat sumber daya sistem, karena layanan tidak perlu melakukan operasi jaringan dan mengalokasikan subtugas untuk setiap operator. Untuk menentukan apakah aplikasi Anda menggunakan rantai operator, lihat grafik pekerjaan di konsol Managed Service for Apache Flink. Setiap simpul dalam aplikasi mewakili satu atau beberapa operator. Grafik menunjukkan operator yang sudah dirantai sebagai satu simpul.