Pemeriksaan status untuk EC2 instans Amazon

Dengan pemantauan status instans, Anda dapat dengan cepat menentukan apakah Amazon EC2 telah mendeteksi masalah yang mungkin mencegah instans Anda menjalankan aplikasi. Amazon EC2 melakukan pemeriksaan otomatis pada setiap EC2 instans yang berjalan untuk mengidentifikasi masalah perangkat keras dan perangkat lunak. Anda dapat melihat hasil dari pemeriksaan status ini untuk mengidentifikasi masalah spesifik yang dapat dideteksi. Data status peristiwa menambah informasi yang EC2 telah disediakan Amazon tentang status setiap instance (sepertipending,running,stopping) dan metrik pemanfaatan yang CloudWatch dipantau Amazon (pemanfaatan CPU, lalu lintas jaringan, dan aktivitas disk).

Pemeriksaan status dilakukan setiap menit dan menghasilkan status lulus atau gagal. Jika semua pemeriksaan lulus, status keseluruhan instans adalah OK. Jika satu atau beberapa pemeriksaan gagal, status keseluruhannya adalah terganggu. Pemeriksaan status dibangun ke Amazon EC2, sehingga tidak dapat dinonaktifkan atau dihapus.

Ketika pemeriksaan status gagal, CloudWatch metrik yang sesuai untuk pemeriksaan status bertambah. Untuk informasi selengkapnya, lihat Metrik pemeriksaan status. Anda dapat menggunakan metrik ini untuk membuat alarm CloudWatch yang dipicu berdasarkan hasil pemeriksaan status. Misalnya, Anda dapat membuat alarm untuk memperingatkan Anda jika pemeriksaan status gagal pada instans tertentu. Untuk informasi selengkapnya, lihat Buat CloudWatch alarm untuk EC2 instans Amazon yang gagal memeriksa status.

Anda juga dapat membuat CloudWatch alarm Amazon yang memantau EC2 instans Amazon dan memulihkan instans secara otomatis jika menjadi rusak karena masalah mendasar. Untuk informasi selengkapnya, lihat Pemulihan instans otomatis.

Daftar Isi

Tipe pemeriksaan status

Ada tiga jenis pemeriksaan status.

Pemeriksaan status sistem
Pemeriksaan status instans
Pemeriksaan status EBS terlampir

Pemeriksaan status sistem

Pemeriksaan status sistem memantau AWS sistem tempat instans Anda berjalan. Pemeriksaan ini mendeteksi masalah yang mendasari instans, yang memerlukan keterlibatan AWS untuk diperbaiki. Ketika pemeriksaan status sistem gagal, Anda dapat memilih untuk menunggu AWS untuk memperbaiki masalah, atau Anda dapat menyelesaikannya sendiri. Untuk instans yang didukung oleh Amazon EBS, Anda dapat menghentikan dan memulai instans sendiri, yang pada sebagian besar kasus akan membuat instans dimigrasikan ke host baru. Untuk instance yang didukung oleh penyimpanan instance (hanya didukung untuk instance Linux), Anda dapat menghentikan dan mengganti instance. Perhatikan bahwa volume penyimpanan instans bersifat sementara dan semua data akan hilang saat instans dihentikan.

Berikut adalah contoh masalah yang dapat menyebabkan kegagalan pemeriksaan status sistem:

Hilangnya konektivitas jaringan
Kehilangan daya sistem
Masalah perangkat lunak pada host fisik
Masalah perangkat keras pada hosting fisik yang memengaruhi jangkauan jaringan

Jika pemeriksaan status sistem gagal, kami menambah metrik StatusCheckFailed_System.

Instans bare metal

Jika Anda memulai ulang dari sistem operasi pada instans bare metal, pemeriksaan status sistem tersebut mungkin kembali ke status gagal untuk sementara. Ketika instans tersedia, pemeriksaan status sistem seharusnya kembali ke status lulus.

Pemeriksaan status instans

Pemeriksaan status instans memantau perangkat lunak dan konektivitas jaringan dari instans individual Anda. Amazon EC2 memeriksa kesehatan instans dengan mengirimkan permintaan protokol resolusi alamat (ARP) ke antarmuka jaringan (NIC). Pemeriksaan ini mendeteksi masalah yang memerlukan keterlibatan Anda untuk memperbaikinya. Jika pemeriksaan status instans gagal, Anda biasanya harus mengatasi sendiri masalah tersebut (misalnya, dengan melakukan boot ulang instans atau membuat perubahan konfigurasi instans).

catatan

Distribusi Linux terbaru yang digunakan systemd-networkd untuk konfigurasi jaringan mungkin melaporkan pemeriksaan kesehatan secara berbeda dari distribusi sebelumnya. Selama proses boot, jenis jaringan ini dapat dimulai lebih awal dan berpotensi selesai sebelum tugas startup lainnya yang juga dapat mempengaruhi kesehatan instance. Pemeriksaan status yang bergantung pada ketersediaan jaringan dapat melaporkan status yang sehat sebelum tugas lain selesai.

Berikut adalah contoh masalah yang dapat menyebabkan kegagalan pemeriksaan status instans:

Pemeriksaan status sistem gagal
Konfigurasi jaringan atau pemulaian salah
Memori habis
Sistem file rusak
Kernel tidak kompatibel
Selama reboot, pemeriksaan status instance melaporkan kegagalan hingga instance tersedia kembali.

Jika pemeriksaan status instance gagal, kami menambah metrik StatusCheckFailed_Instance.

Instans bare metal

Jika Anda memulai ulang dari sistem operasi pada instans bare metal, pemeriksaan status instans tersebut mungkin akan kembali ke status gagal untuk sementara. Ketika instans tersedia, pemeriksaan status instans seharusnya kembali ke status lulus.

Pemeriksaan status EBS terlampir

Pemeriksaan status EBS terlampir memantau apakah volume Amazon EBS yang dilampirkan ke instans dapat dijangkau dan dapat menyelesaikan operasi. I/O StatusCheckFailed_AttachedEBSMetrik adalah nilai biner yang menunjukkan penurunan jika satu atau lebih volume EBS yang melekat pada instance tidak dapat menyelesaikan I/O operasi. Pemeriksaan status ini mendeteksi masalah yang mendasari komputasi atau infrastruktur Amazon EBS. Jika metrik pemeriksaan status EBS terlampir gagal, Anda dapat menunggu AWS untuk menyelesaikan masalah, atau Anda dapat mengambil tindakan, seperti mengganti volume yang terpengaruh atau menghentikan dan memulai ulang instance.

Berikut adalah contoh masalah yang dapat menyebabkan kegagalan pemeriksaan status EBS terlampir:

Masalah perangkat keras atau perangkat lunak pada subsistem penyimpanan yang mendasari volume EBS
Masalah perangkat keras pada host fisik yang memengaruhi jangkauan volume EBS
Masalah konektivitas antara instans dan volume EBS

Anda dapat menggunakan metrik StatusCheckFailed_AttachedEBS untuk membantu meningkatkan ketahanan beban kerja Anda. Anda dapat menggunakan metrik ini untuk membuat CloudWatch alarm Amazon yang dipicu berdasarkan hasil pemeriksaan status. Misalnya, Anda dapat melakukan failover ke instans sekunder atau Zona Ketersediaan saat mendeteksi adanya dampak yang berkepanjangan. Atau, Anda dapat memantau volume EBS apa pun yang dilampirkan ke instans Anda, dan pemeriksaan status EBS menunjukkan penurunan, Anda dapat menghentikan dan memulai instans untuk memindahkannya ke host baru. I/O performance of each attached volume using EBS CloudWatch metrics to detect and replace the impaired volume. If your workload is not driving I/O Ini dapat menyelesaikan masalah host mendasar yang memengaruhi jangkauan volume EBS. Untuk informasi selengkapnya, lihat CloudWatch Metrik Amazon untuk Amazon EBS.

Anda juga dapat mengonfigurasi grup EC2 Auto Scaling Amazon untuk mendeteksi kegagalan pemeriksaan status EBS terlampir, lalu mengganti instans yang terpengaruh dengan yang baru. Untuk informasi selengkapnya, lihat Memantau dan mengganti instans Auto Scaling dengan volume Amazon EBS yang terganggu di Panduan Pengguna Auto Scaling EC2 Amazon.

catatan

Metrik pemeriksaan status EBS yang terlampir hanya tersedia untuk instans Nitro.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Memantau status instans Anda

Melihat pemeriksaan status