Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pemeriksaan status untuk EC2 instans Amazon
Dengan pemantauan status instans, Anda dapat dengan cepat menentukan apakah Amazon EC2 telah mendeteksi masalah apa pun yang mungkin mencegah instans Anda menjalankan aplikasi. Amazon EC2 melakukan pemeriksaan otomatis pada setiap EC2 instans yang berjalan untuk mengidentifikasi masalah perangkat keras dan perangkat lunak. Anda dapat melihat hasil dari pemeriksaan status ini untuk mengidentifikasi masalah spesifik yang dapat dideteksi. Data status peristiwa menambah informasi yang EC2 sudah diberikan Amazon tentang status setiap instans (sepertipending
,running
,stopping
) dan metrik penggunaan yang CloudWatch dipantau Amazon (CPUpemanfaatan, lalu lintas jaringan, dan aktivitas disk).
Pemeriksaan status dilakukan setiap menit dan menghasilkan status lulus atau gagal. Jika semua pemeriksaan lulus, status keseluruhan instans adalah OK. Jika satu atau beberapa pemeriksaan gagal, status keseluruhannya adalah terganggu. Pemeriksaan status dibangun di Amazon EC2 sehingga pemeriksaan tersebut tidak dapat dinonaktifkan atau dihapus.
Ketika pemeriksaan status gagal, CloudWatch metrik terkait untuk pemeriksaan status ditingkatkan. Untuk informasi selengkapnya, lihat Metrik pemeriksaan status. Anda dapat menggunakan metrik ini untuk membuat CloudWatch alarm yang dipicu berdasarkan hasil pemeriksaan status. Misalnya, Anda dapat membuat alarm untuk memperingatkan Anda jika pemeriksaan status gagal pada instans tertentu. Untuk informasi selengkapnya, lihat Buat CloudWatch alarm untuk EC2 instans Amazon yang gagal memeriksa status.
Anda dapat membuat CloudWatch alarm Amazon yang memantau EC2 instans Amazon dan secara otomatis memulihkan instans jika rusak akibat kegagalan perangkat keras yang mendasarinya. Untuk informasi selengkapnya, lihat Ketahanan contoh.
Daftar Isi
Tipe pemeriksaan status
Ada tiga jenis pemeriksaan status.
Pemeriksaan status sistem
Pemeriksaan status sistem memantau AWS sistem tempat instans Anda berjalan. Pemeriksaan ini mendeteksi masalah yang mendasari instans, yang memerlukan keterlibatan AWS untuk diperbaiki. Jika pemeriksaan status sistem gagal, Anda dapat memilih AWS untuk memperbaiki masalah tersebut, atau Anda dapat memecahkannya sendiri. Untuk instans yang didukung oleh AmazonEBS, Anda dapat menghentikan dan memulai instans sendiri, yang pada sebagian besar kasus akan mengakibatkan migrasi instans ke host baru. Untuk instans Linux yang didukung oleh penyimpanan instans, Anda dapat mengakhiri dan mengganti instans tersebut. Untuk instans Windows, volume root harus berupa EBS volume Amazon; penyimpanan instans tidak didukung untuk volume root. Perhatikan bahwa volume penyimpanan instans bersifat sementara dan semua data akan hilang saat instans dihentikan.
Berikut adalah contoh masalah yang dapat menyebabkan kegagalan pemeriksaan status sistem:
-
Hilangnya konektivitas jaringan
-
Kehilangan daya sistem
-
Masalah perangkat lunak pada host fisik
-
Masalah perangkat keras pada hosting fisik yang memengaruhi jangkauan jaringan
Jika pemeriksaan status sistem gagal, kami menambah metrik StatusCheckFailed_System.
Instans bare metal
Jika Anda memulai ulang dari sistem operasi pada instans bare metal, pemeriksaan status sistem tersebut mungkin kembali ke status gagal untuk sementara. Ketika instans tersedia, pemeriksaan status sistem seharusnya kembali ke status lulus.
Pemeriksaan status instans
Pemeriksaan status instans memantau konfigurasi jaringan dan perangkat lunak pada tiap-tiap instans Anda secara terpisah. Amazon EC2 memeriksa kesehatan instance dengan mengirimkan permintaan address resolution protocol (ARP) ke network interface (NIC). Pemeriksaan ini mendeteksi masalah yang memerlukan keterlibatan Anda untuk memperbaikinya. Jika pemeriksaan status instans gagal, Anda biasanya harus mengatasi sendiri masalah tersebut (misalnya, dengan melakukan boot ulang instans atau membuat perubahan konfigurasi instans).
catatan
Distribusi Linux terbaru yang digunakan systemd-networkd
untuk konfigurasi jaringan mungkin melaporkan pemeriksaan kesehatan secara berbeda dari distribusi sebelumnya. Selama proses boot, jenis jaringan ini dapat dimulai lebih awal dan berpotensi selesai sebelum tugas startup lainnya yang juga dapat mempengaruhi kesehatan instance. Pemeriksaan status yang bergantung pada ketersediaan jaringan dapat melaporkan status yang sehat sebelum tugas lain selesai.
Berikut adalah contoh masalah yang dapat menyebabkan kegagalan pemeriksaan status instans:
-
Pemeriksaan status sistem gagal
-
Konfigurasi jaringan atau pemulaian salah
-
Memori habis
-
Sistem file rusak
-
Kernel tidak kompatibel
-
[Instans Windows] Selama boot ulang instans atau saat instans yang didukung penyimpanan instans Windows sedang dibundel, pemeriksaan status instans melaporkan kegagalan sampai instans tersebut tersedia lagi.
Jika pemeriksaan status instance gagal, kami menambah metrik StatusCheckFailed_Instance.
Instans bare metal
Jika Anda memulai ulang dari sistem operasi pada instans bare metal, pemeriksaan status instans tersebut mungkin akan kembali ke status gagal untuk sementara. Ketika instans tersedia, pemeriksaan status instans seharusnya kembali ke status lulus.
Pemeriksaan EBS status terlampir
Pemeriksaan EBS status terlampir memantau jika EBS volume Amazon yang dilampirkan ke instans dapat dijangkau dan dapat menyelesaikan operasi I/O. StatusCheckFailed_AttachedEBS
Metrik adalah nilai biner yang menunjukkan penurunan jika satu atau lebih EBS volume yang melekat pada instance tidak dapat menyelesaikan operasi I/O. Pemeriksaan status ini mendeteksi masalah mendasar dengan komputasi atau EBS infrastruktur Amazon. Jika metrik pemeriksaan EBS status terlampir gagal, Anda dapat menunggu AWS untuk menyelesaikan masalah, atau Anda dapat mengambil tindakan, seperti mengganti volume yang terpengaruh atau menghentikan dan memulai ulang instance.
Berikut adalah contoh masalah yang dapat menyebabkan pemeriksaan EBS status terlampir gagal:
-
Masalah perangkat keras atau perangkat lunak pada subsistem penyimpanan yang mendasari volume EBS
-
Masalah perangkat keras pada hosting fisik yang memengaruhi jangkauan volume EBS
-
Masalah konektivitas antara instance dan EBS volume
Anda dapat menggunakan metrik StatusCheckFailed_AttachedEBS
untuk membantu meningkatkan ketahanan beban kerja Anda. Anda dapat menggunakan metrik ini untuk membuat CloudWatch alarm Amazon yang dipicu berdasarkan hasil pemeriksaan status. Misalnya, Anda dapat melakukan failover ke instans sekunder atau Zona Ketersediaan saat mendeteksi adanya dampak yang berkepanjangan. Atau, Anda dapat memantau kinerja I/O dari setiap volume yang terpasang menggunakan EBS CloudWatch metrik untuk mendeteksi dan mengganti volume yang terganggu. Jika beban kerja Anda tidak mendorong I/O ke salah satu EBS volume yang dilampirkan pada instans Anda, dan pemeriksaan EBS status terlampir menunjukkan adanya gangguan, Anda dapat menghentikan dan memulai instance untuk mengatasi masalah dengan host fisik yang memengaruhi jangkauan volume. EBS Untuk informasi selengkapnya, lihat CloudWatch Metrik Amazon untuk Amazon EBS.
Anda juga dapat mengonfigurasi grup EC2 Auto Scaling Amazon untuk mendeteksi kegagalan pemeriksaan EBS status terlampir, lalu mengganti instance yang terpengaruh dengan yang baru. Untuk informasi selengkapnya, lihat Memantau dan mengganti instans Auto Scaling dengan EBS volume Amazon yang terganggu di Panduan Pengguna Penskalaan EC2 Otomatis Amazon.
catatan
Metrik pemeriksaan EBS status terlampir hanya tersedia untuk instans Nitro.