Cara kerja rencana penyekalaan - AWS Auto Scaling

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Cara kerja rencana penyekalaan

AWS Auto Scaling memungkinkan Anda menggunakan rencana penskalaan untuk mengonfigurasi serangkaian instruksi untuk menskalakan sumber daya Anda. Jika Anda bekerja dengan AWS CloudFormation atau menambahkan tag ke sumber daya yang dapat diskalakan, Anda dapat menyiapkan rencana penskalaan untuk kumpulan sumber daya yang berbeda, per aplikasi. AWS Auto Scaling Konsol memberikan rekomendasi untuk strategi penskalaan yang disesuaikan untuk setiap sumber daya. Setelah Anda membuat rencana penskalaan Anda, ini menggabungkan penskalaan dinamis dan metode penskalaan prediktif bersama-sama untuk mendukung strategi penskalaan Anda.

Apa itu strategi penyekalaan?

Strategi penskalaan memberi tahu AWS Auto Scaling cara mengoptimalkan pemanfaatan sumber daya dalam rencana penskalaan Anda. Anda dapat mengoptimalkan ketersediaan, untuk biaya, atau keseimbangan keduanya. Atau, Anda juga dapat membuat strategi kustom sendiri, sesuai metrik dan ambang batas yang Anda tentukan. Anda dapat menetapkan strategi terpisah untuk setiap sumber daya atau jenis sumber daya.

Strategi penskalaan termasuk mengoptimalkan ketersediaan versus biaya, atau keseimbangan di antara keduanya.
Apa itu penyekalaan dinamis?

Skala dinamis menciptakan kebijakan penyekalaan pelacakan target untuk sumber daya dalam rencana penyekalaan Anda. Kebijakan penyekalaan ini menyesuaikan kapasitas sumber daya dalam menanggapi perubahan langsung dalam pemanfaatan sumber daya. Tujuannya adalah untuk memberikan kapasitas yang cukup untuk mempertahankan pemanfaatan pada nilai target yang ditentukan oleh strategi penyekalaan. Hal ini serupa dengan cara termostat Anda menjaga suhu di rumah Anda. Anda memilih suhu dan termostat akan melakukan sisanya.

Grafik membandingkan pemanfaatan dan kapasitas dengan dan tanpa penskalaan dinamis.

Misalnya, Anda dapat mengonfigurasi paket penskalaan untuk menjaga jumlah tugas yang dijalankan oleh layanan Amazon Elastic Container Service (Amazon ECS) pada 75 persen CPU. Ketika pemanfaatan CPU layanan Anda melebihi 75 persen (artinya lebih dari 75 persen CPU yang dicadangkan untuk layanan sedang digunakan), maka kebijakan penskalaan Anda menambahkan tugas lain ke layanan Anda untuk membantu peningkatan beban.

Apa itu penyekalaan prediktif?

Penskalaan prediktif menggunakan pembelajaran mesin untuk menganalisis beban kerja historis setiap sumber daya dan secara teratur memperkirakan beban masa depan. Hal ini serupa dengan cara kerja prakiraan cuaca. Menggunakan perkiraan, skala prediktif menghasilkan tindakan penyekalaan terjadwal untuk memastikan kapasitas sumber daya tersedia sebelum aplikasi Anda membutuhkannya. Seperti penyekalaan dinamis, penyekalaan prediktif bekerja untuk mempertahankan pemanfaatan pada nilai target yang ditentukan oleh strategi penyekalaan.

Grafik yang menunjukkan beban historis, perkiraan yang dihasilkan, dan tindakan penskalaan yang diambil.

Misalnya, Anda dapat mengaktifkan penyekalaan prediktif dan mengkonfigurasi strategi penyekalaan Anda untuk menjaga pemanfaatan CPU rata-rata dari grup Auto Scaling Anda sebesar 50 persen. Perkiraan Anda meminta lonjakan lalu lintas terjadi setiap hari pada pukul 8:00. Rencana penyekalaan Anda menciptakan tindakan penyekalaan terjadwal di masa depan untuk memastikan bahwa kelompok Auto Scaling Anda siap menangani lalu lintas tersebut di masa mendatang. Hal ini membantu menjaga kinerja aplikasi tetap konstan, dengan tujuan untuk selalu memiliki kapasitas yang diperlukan untuk mempertahankan pemanfaatan sumber daya sedekat 50 persen mungkin setiap saat.

Berikut ini adalah konsep kunci untuk memahami penskalaan prediktif:

  • Peramalan beban: AWS Auto Scaling menganalisis hingga 14 hari sejarah untuk metrik beban tertentu dan memperkirakan permintaan masa depan untuk dua hari ke depan. Data ini tersedia dalam interval satu jam dan diperbarui setiap hari.

  • Tindakan penskalaan AWS Auto Scaling terjadwal: menjadwalkan tindakan penskalaan yang secara proaktif meningkatkan dan mengurangi kapasitas agar sesuai dengan perkiraan beban. Pada waktu yang dijadwalkan, AWS Auto Scaling perbarui kapasitas minimum dengan nilai yang ditentukan oleh tindakan penskalaan terjadwal. Tujuannya adalah untuk mempertahankan pemanfaatan sumber daya pada nilai target yang ditentukan oleh strategi penyekalaan. Jika aplikasi Anda memerlukan kapasitas yang lebih besar daripada prakiraan, skala dinamis tersedia untuk menambahkan kapasitas tambahan.

  • Perilaku kapasitas maksimum: Batas kapasitas minimum dan maksimum untuk penskalaan otomatis berlaku untuk setiap sumber daya. Namun, Anda dapat mengontrol apakah aplikasi Anda dapat meningkatkan kapasitas melebihi kapasitas maksimum ketika kapasitas perkiraan lebih tinggi dari kapasitas maksimum.

catatan

Anda sekarang dapat menggunakan kebijakan penskalaan prediktif grup Auto Scaling sebagai gantinya. Untuk informasi selengkapnya, lihat Penskalaan prediktif untuk Auto Scaling Amazon EC2 di Panduan Pengguna Auto Scaling Amazon EC2.