Hitung penskalaan - AWS Panduan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Hitung penskalaan

Compute scaling adalah komponen penting untuk kinerja aplikasi dalam lingkungan Kubernetes yang dinamis. Kubernetes mengurangi pemborosan melalui penyesuaian dinamis sumber daya komputasi (seperti CPU dan memori) sebagai respons terhadap permintaan real-time. Kemampuan ini membantu menghindari penyediaan yang berlebihan atau kurang, yang juga dapat menghemat biaya operasional. Kubernetes secara efektif menghilangkan kebutuhan akan intervensi manual dengan memungkinkan infrastruktur meningkat secara otomatis selama jam sibuk dan turun selama periode off-peak.

Penskalaan komputasi Kubernetes secara keseluruhan mengotomatiskan proses penskalaan, yang meningkatkan fleksibilitas dan skalabilitas aplikasi serta meningkatkan perilaku toleran kesalahan. Pada akhirnya, kemampuan Kubernetes meningkatkan keunggulan operasional dan produktivitas.

Bagian ini membahas jenis penskalaan komputasi berikut:

Cluster AutoScaler

Bergantung pada kebutuhan pod, alat Cluster Autoscaler secara otomatis memodifikasi ukuran dengan menambahkan node bila diperlukan atau menghapus node saat tidak diperlukan dan kurang dimanfaatkan.

Pertimbangkan alat Cluster Autoscaler sebagai solusi penskalaan untuk beban kerja di mana permintaan meningkat secara bertahap dan latensi dalam penskalaan bukanlah masalah utama.

Alat Cluster Autoscaler menyediakan fitur-fitur utama berikut:

  • Penskalaan — Menskalakan node naik dan turun secara dinamis sebagai respons terhadap permintaan sumber daya yang sebenarnya.

  • Penjadwalan Pod — Membantu memastikan bahwa setiap pod beroperasi dan memiliki sumber daya yang dibutuhkan untuk berfungsi, mencegah kelangkaan sumber daya.

  • Efisiensi biaya — Menghilangkan biaya yang tidak perlu untuk mengoperasikan node yang kurang dimanfaatkan dengan menghilangkannya.

Cluster Autoscaler dengan penyediaan berlebih

Cluster Autoscaler dengan fungsi over-provisioning yang mirip dengan Cluster Autoscaler karena ia menyebarkan node secara efisien dan menghemat waktu dengan menjalankan pod prioritas rendah pada node. Dengan teknik ini, lalu lintas dialihkan ke pod ini sebagai respons terhadap lonjakan permintaan yang tiba-tiba, memungkinkan aplikasi untuk terus beroperasi tanpa gangguan.

Cluster Autoscaler dengan over-provisioning menawarkan fitur dummy pod yang dapat digunakan untuk menyebarkan dan menjalankan node dengan mudah saat beban kerja sangat besar, latensi tidak diperlukan, dan penskalaan harus cepat.

Cluster Autoscaler dengan over-provisioning menyediakan fitur utama berikut:

  • Responsif yang lebih baik — Dengan membuat kelebihan kapasitas dapat diakses secara konstan, dibutuhkan lebih sedikit waktu untuk meningkatkan klaster sebagai respons terhadap lonjakan permintaan.

  • Reservasi sumber daya — Mengelola lonjakan lalu lintas yang tidak terduga secara efektif membantu manajemen yang benar dengan sedikit waktu henti.

  • Penskalaan yang lancar — Meminimalkan penundaan alokasi sumber daya memfasilitasi proses penskalaan yang lebih mulus.

Karpenter

Karpenter for Kubernetes mengungguli alat Cluster Autoscaler tradisional dalam hal open source, kinerja, dan kemampuan penyesuaian. Dengan Karpenter, Anda dapat secara otomatis meluncurkan hanya sumber daya komputasi yang diperlukan untuk menangani permintaan cluster Anda secara real time. Karpenter dirancang untuk memberikan penskalaan yang lebih efisien dan responsif.

Aplikasi dengan beban kerja yang sangat bervariasi atau kompleks, di mana keputusan penskalaan cepat sangat penting, mendapat manfaat besar dari penggunaan Karpenter. Ini terintegrasi dengan AWS, menawarkan penerapan yang lebih baik dan optimasi pemilihan simpul.

Karpenter mencakup fitur-fitur utama berikut:

  • Penyediaan dinamis — Karpenter menyediakan instance dan ukuran yang tepat untuk tujuan tersebut dan menyediakan node baru secara dinamis berdasarkan persyaratan tertentu dari pod.

  • Penjadwalan lanjutan — Menggunakan penempatan pod yang cerdas, Karpenter mengatur node sedemikian rupa sehingga sumber daya seperti GPU, CPU, memori, dan penyimpanan digunakan seefektif mungkin.

  • Penskalaan cepat — Karpenter dapat menskalakan dengan cepat, sering bereaksi dalam hitungan detik. Responsif ini sangat membantu untuk pola lalu lintas mendadak atau ketika beban kerja menuntut penskalaan segera

  • Efisiensi biaya — Dengan memilih instans yang paling efektif dengan cermat, Anda dapat menurunkan biaya pengoperasian dan memanfaatkan alternatif penghematan biaya tambahan yang ditawarkan oleh AWS, seperti Instans Sesuai Permintaan, Instans Spot, dan Instans Cadangan.