Cara kerjanya Batas kapasitas maksimum Pertimbangan Wilayah yang Didukung

Cara kerja penskalaan prediktif

Topik ini menjelaskan cara kerja penskalaan prediktif dan menjelaskan apa yang harus dipertimbangkan saat Anda membuat kebijakan penskalaan prediktif.

Topik

Cara kerjanya
Batas kapasitas maksimum
Pertimbangan
Wilayah yang Didukung

Cara kerjanya

Untuk menggunakan penskalaan prediktif, buat kebijakan penskalaan prediktif yang menentukan CloudWatch metrik untuk dipantau dan dianalisis. Agar penskalaan prediktif mulai meramalkan nilai masa depan, metrik ini harus memiliki setidaknya 24 jam data.

Setelah Anda membuat kebijakan, penskalaan prediktif mulai menganalisis data metrik hingga 14 hari terakhir untuk mengidentifikasi pola. Ini menggunakan analisis ini untuk menghasilkan perkiraan per jam persyaratan kapasitas untuk 48 jam ke depan. Prakiraan diperbarui setiap 6 jam menggunakan CloudWatch data terbaru. Saat data baru masuk, penskalaan prediktif mampu terus meningkatkan akurasi prakiraan masa depan.

Saat Anda pertama kali mengaktifkan penskalaan prediktif, penskalaan ini berjalan dalam mode perkiraan saja. Dalam mode ini, ini menghasilkan perkiraan kapasitas tetapi tidak benar-benar menskalakan grup Auto Scaling Anda berdasarkan perkiraan tersebut. Ini memungkinkan Anda untuk mengevaluasi keakuratan dan kesesuaian ramalan. Anda dapat melihat data perkiraan dengan menggunakan operasi GetPredictiveScalingForecast API atau AWS Management Console.

Setelah Anda meninjau data perkiraan dan memutuskan untuk memulai penskalaan berdasarkan data tersebut, alihkan kebijakan penskalaan ke mode perkiraan dan skala. Dalam mode ini:

Jika perkiraan mengharapkan peningkatan beban, Amazon EC2 Auto Scaling akan meningkatkan kapasitas dengan menskalakan.
Jika perkiraan mengharapkan penurunan beban, itu tidak akan skala untuk menghapus kapasitas. Jika Anda ingin menghapus kapasitas yang tidak lagi diperlukan, Anda harus membuat kebijakan penskalaan dinamis.

Secara default, Amazon EC2 Auto Scaling menskalakan grup Auto Scaling Anda pada awal setiap jam berdasarkan perkiraan untuk jam tersebut. Anda dapat menentukan waktu mulai yang lebih awal secara opsional dengan menggunakan SchedulingBufferTime properti dalam operasi PutScalingPolicy API atau setelan instans Pra-peluncuran di. AWS Management Console Hal ini menyebabkan Amazon EC2 Auto Scaling meluncurkan instans baru sebelum permintaan yang diperkirakan, memberi mereka waktu untuk boot dan siap menangani lalu lintas.

Untuk mendukung peluncuran instans baru sebelum permintaan yang diperkirakan, kami sangat menyarankan agar Anda mengaktifkan pemanasan instans default untuk grup Auto Scaling Anda. Ini menentukan periode waktu setelah aktivitas scale-out selama EC2 Auto Scaling Amazon tidak akan diskalakan, meskipun kebijakan penskalaan dinamis menunjukkan kapasitas harus dikurangi. Ini membantu Anda memastikan bahwa instans yang baru diluncurkan memiliki waktu yang cukup untuk mulai melayani peningkatan lalu lintas sebelum dipertimbangkan untuk operasi skala. Untuk informasi selengkapnya, lihat Mengatur pemanasan instans default untuk grup Auto Scaling.

Batas kapasitas maksimum

Grup Auto Scaling memiliki pengaturan kapasitas maksimum yang membatasi jumlah maksimum EC2 instans yang dapat diluncurkan untuk grup. Secara default, ketika kebijakan penskalaan ditetapkan, mereka tidak dapat meningkatkan kapasitas lebih tinggi dari kapasitas maksimumnya.

Atau, Anda dapat mengizinkan kapasitas maksimum grup ditingkatkan secara otomatis jika kapasitas perkiraan mendekati atau melebihi kapasitas maksimum grup Auto Scaling. Untuk mengaktifkan perilaku ini, gunakan MaxCapacityBuffer properti MaxCapacityBreachBehavior dan dalam operasi PutScalingPolicy API atau setelan perilaku kapasitas Maks di AWS Management Console.

Awas

Berhati-hatilah saat memungkinkan kapasitas maksimum ditingkatkan secara otomatis. Hal ini dapat menyebabkan lebih banyak instance diluncurkan daripada yang dimaksudkan jika peningkatan kapasitas maksimum tidak dipantau dan dikelola. Peningkatan kapasitas maksimum kemudian menjadi kapasitas maksimum normal baru untuk grup Auto Scaling hingga Anda memperbaruinya secara manual. Kapasitas maksimum tidak secara otomatis berkurang kembali ke maksimum asli.

Pertimbangan

Konfirmasikan apakah penskalaan prediktif cocok untuk beban kerja Anda. Beban kerja sangat cocok untuk penskalaan prediktif jika menunjukkan pola beban berulang yang spesifik untuk hari dalam seminggu atau waktu dalam sehari. Untuk memeriksanya, konfigurasikan kebijakan penskalaan prediktif dalam mode hanya perkiraan, lalu lihat rekomendasi di konsol. Amazon EC2 Auto Scaling memberikan rekomendasi berdasarkan pengamatan tentang potensi kinerja kebijakan. Evaluasi perkiraan dan rekomendasi sebelum membiarkan penskalaan prediktif secara aktif menskalakan aplikasi Anda.
Penskalaan prediktif membutuhkan setidaknya 24 jam data historis untuk memulai peramalan. Namun, perkiraan lebih efektif jika data historis mencakup dua minggu penuh. Jika Anda memperbarui aplikasi Anda dengan membuat grup Auto Scaling baru dan menghapus yang lama, maka grup Auto Scaling baru Anda memerlukan 24 jam data pemuatan historis sebelum penskalaan prediktif dapat mulai menghasilkan prakiraan lagi. Anda dapat menggunakan metrik khusus untuk menggabungkan metrik di seluruh grup Auto Scaling lama dan baru. Jika tidak, Anda mungkin harus menunggu beberapa hari untuk perkiraan yang lebih akurat.
Pilih metrik pemuatan yang secara akurat mewakili beban penuh pada aplikasi Anda dan merupakan aspek aplikasi Anda yang paling penting untuk diskalakan.
Menggunakan penskalaan dinamis dengan penskalaan prediktif membantu Anda mengikuti kurva permintaan untuk aplikasi Anda dengan cermat, penskalaan selama periode lalu lintas rendah dan penskalaan saat lalu lintas lebih tinggi dari yang diharapkan. Ketika beberapa kebijakan penskalaan aktif, setiap kebijakan menentukan kapasitas yang diinginkan secara independen, dan kapasitas yang diinginkan diatur ke maksimum dari mereka. Misalnya, jika 10 instans diperlukan untuk tetap pada pemanfaatan target dalam kebijakan penskalaan pelacakan target, dan 8 instance diperlukan untuk tetap pada pemanfaatan target dalam kebijakan penskalaan prediktif, maka kapasitas yang diinginkan grup ditetapkan ke 10. Jika Anda baru mengenal penskalaan dinamis, sebaiknya gunakan kebijakan penskalaan pelacakan target. Untuk informasi selengkapnya, lihat Penskalaan dinamis untuk EC2 Auto Scaling Amazon.
Asumsi inti dari penskalaan prediktif adalah bahwa grup Auto Scaling homogen dan semua instance memiliki kapasitas yang sama. Jika ini tidak benar untuk grup Anda, kapasitas yang diperkirakan bisa tidak akurat. Oleh karena itu, berhati-hatilah saat membuat kebijakan penskalaan prediktif untuk grup instance campuran karena instance dari berbagai jenis dapat disediakan dengan kapasitas yang tidak sama. Berikut adalah beberapa contoh di mana kapasitas yang diperkirakan tidak akurat:
- Kebijakan penskalaan prediktif Anda didasarkan pada pemanfaatan CPU, tetapi jumlah v CPUs pada setiap instans Auto Scaling bervariasi antar jenis instans.
- Kebijakan penskalaan prediktif Anda didasarkan pada jaringan masuk atau keluar jaringan, tetapi throughput bandwidth jaringan untuk setiap instans Auto Scaling bervariasi antar jenis instans. Misalnya, tipe instans M5 dan M5n serupa, tetapi tipe instans M5n memberikan throughput jaringan yang jauh lebih tinggi.

Wilayah yang Didukung

AS Timur (N. Virginia)
AS Timur (Ohio)
AS Barat (California Utara)
AS Barat (Oregon)
Afrika (Cape Town)
Asia Pasifik (Hong Kong)
Asia Pasifik (Jakarta)
Asia Pasifik (Mumbai)
Asia Pasifik (Osaka)
Asia Pasifik (Seoul)
Asia Pasifik (Singapura)
Asia Pasifik (Sydney)
Asia Pasifik (Tokyo)
Kanada (Pusat)
Tiongkok (Beijing)
Tiongkok (Ningxia)
Eropa (Frankfurt)
Eropa (Irlandia)
Eropa (London)
Eropa (Milan)
Eropa (Paris)
Eropa (Stockholm)
Timur Tengah (Bahrain)
Timur Tengah (UEA)
Amerika Selatan (Sao Paulo)
AWS GovCloud (AS-Timur)
AWS GovCloud (AS-Barat)

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Penskalaan prediktif

Buat kebijakan penskalaan prediktif