Penskalaan prediktif untuk Auto Scaling Amazon EC2 - Amazon EC2 Auto Scaling

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Penskalaan prediktif untuk Auto Scaling Amazon EC2

Penskalaan prediktif bekerja dengan menganalisis data beban historis untuk mendeteksi pola harian atau mingguan dalam arus lalu lintas. Ini menggunakan informasi ini untuk memperkirakan kebutuhan kapasitas masa depan sehingga Amazon EC2 Auto Scaling dapat secara proaktif meningkatkan kapasitas grup Auto Scaling Anda agar sesuai dengan beban yang diantisipasi.

Penskalaan prediktif sangat cocok untuk situasi di mana Anda memiliki:

  • Lalu lintas siklus, seperti penggunaan sumber daya yang tinggi selama jam kerja reguler dan penggunaan sumber daya yang rendah selama malam hari dan akhir pekan

  • Pola on-and-off beban kerja berulang, seperti pemrosesan batch, pengujian, atau analisis data berkala

  • Aplikasi yang membutuhkan waktu lama untuk diinisialisasi, menyebabkan dampak latensi yang nyata pada kinerja aplikasi selama peristiwa penskalaan

Secara umum, jika Anda memiliki pola peningkatan lalu lintas reguler dan aplikasi yang membutuhkan waktu lama untuk diinisialisasi, Anda harus mempertimbangkan untuk menggunakan penskalaan prediktif. Penskalaan prediktif dapat membantu Anda menskalakan lebih cepat dengan meluncurkan kapasitas sebelum beban yang diperkirakan, dibandingkan dengan hanya menggunakan penskalaan dinamis, yang bersifat reaktif. Penskalaan prediktif juga berpotensi menghemat uang pada tagihan EC2 Anda dengan membantu Anda menghindari kebutuhan untuk kapasitas penyediaan yang berlebihan.

Misalnya, pertimbangkan aplikasi yang memiliki penggunaan tinggi selama jam kerja dan penggunaan rendah dalam semalam. Pada awal setiap hari kerja, penskalaan prediktif dapat menambah kapasitas sebelum masuknya lalu lintas pertama. Ini membantu aplikasi Anda mempertahankan ketersediaan dan kinerja tinggi saat beralih dari periode pemanfaatan yang lebih rendah ke periode pemanfaatan yang lebih tinggi. Anda tidak perlu menunggu penskalaan dinamis untuk bereaksi terhadap perubahan lalu lintas. Anda juga tidak perlu menghabiskan waktu untuk meninjau pola pemuatan aplikasi Anda dan mencoba menjadwalkan jumlah kapasitas yang tepat menggunakan penskalaan terjadwal.