Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Dengan pemantauan status instans, Anda dapat dengan cepat menentukan apakah Amazon EC2 telah mendeteksi masalah yang mungkin mencegah instans Anda menjalankan aplikasi. Amazon EC2 melakukan pemeriksaan otomatis pada setiap EC2 instans yang berjalan untuk mengidentifikasi masalah perangkat keras dan perangkat lunak. Anda dapat melihat hasil dari pemeriksaan status ini untuk mengidentifikasi masalah spesifik yang dapat dideteksi. Data status peristiwa menambah informasi yang EC2 telah disediakan Amazon tentang status setiap instance (sepertipending
,running
,stopping
) dan metrik pemanfaatan yang CloudWatch dipantau Amazon (pemanfaatan CPU, lalu lintas jaringan, dan aktivitas disk).
Pemeriksaan status dilakukan setiap menit dan menghasilkan status lulus atau gagal. Jika semua pemeriksaan lulus, status keseluruhan instans adalah OK. Jika satu atau beberapa pemeriksaan gagal, status keseluruhannya adalah terganggu. Pemeriksaan status dibangun ke Amazon EC2, sehingga tidak dapat dinonaktifkan atau dihapus.
Ketika pemeriksaan status gagal, CloudWatch metrik yang sesuai untuk pemeriksaan status bertambah. Untuk informasi selengkapnya, lihat Metrik pemeriksaan status. Anda dapat menggunakan metrik ini untuk membuat alarm CloudWatch yang dipicu berdasarkan hasil pemeriksaan status. Misalnya, Anda dapat membuat alarm untuk memperingatkan Anda jika pemeriksaan status gagal pada instans tertentu. Untuk informasi selengkapnya, lihat Buat CloudWatch alarm untuk EC2 instans Amazon yang gagal memeriksa status.
Anda juga dapat membuat CloudWatch alarm Amazon yang memantau EC2 instans Amazon dan memulihkan instans secara otomatis jika menjadi rusak karena masalah mendasar. Untuk informasi selengkapnya, lihat Pemulihan instans otomatis.
Daftar Isi
Tipe pemeriksaan status
Ada tiga jenis pemeriksaan status.
Pemeriksaan status sistem
Pemeriksaan status sistem memantau AWS sistem tempat instans Anda berjalan. Pemeriksaan ini mendeteksi masalah yang mendasari instans, yang memerlukan keterlibatan AWS untuk diperbaiki. Ketika pemeriksaan status sistem gagal, Anda dapat memilih untuk menunggu AWS untuk memperbaiki masalah, atau Anda dapat menyelesaikannya sendiri. Untuk instans yang didukung oleh Amazon EBS, Anda dapat menghentikan dan memulai instans sendiri, yang pada sebagian besar kasus akan membuat instans dimigrasikan ke host baru. Untuk instans Linux yang didukung oleh penyimpanan instans, Anda dapat mengakhiri dan mengganti instans tersebut. Untuk instans Windows, volume root harus berupa volume Amazon EBS. Penyimpanan instans tidak didukung untuk volume root. Perhatikan bahwa volume penyimpanan instans bersifat sementara dan semua data akan hilang saat instans dihentikan.
Berikut adalah contoh masalah yang dapat menyebabkan kegagalan pemeriksaan status sistem:
-
Hilangnya konektivitas jaringan
-
Kehilangan daya sistem
-
Masalah perangkat lunak pada host fisik
-
Masalah perangkat keras pada hosting fisik yang memengaruhi jangkauan jaringan
Jika pemeriksaan status sistem gagal, kami menambah metrik StatusCheckFailed_System.
Instans bare metal
Jika Anda memulai ulang dari sistem operasi pada instans bare metal, pemeriksaan status sistem tersebut mungkin kembali ke status gagal untuk sementara. Ketika instans tersedia, pemeriksaan status sistem seharusnya kembali ke status lulus.
Pemeriksaan status instans
Pemeriksaan status instans memantau perangkat lunak dan konektivitas jaringan dari instans individual Anda. Amazon EC2 memeriksa kesehatan instans dengan mengirimkan permintaan protokol resolusi alamat (ARP) ke antarmuka jaringan (NIC). Pemeriksaan ini mendeteksi masalah yang memerlukan keterlibatan Anda untuk memperbaikinya. Jika pemeriksaan status instans gagal, Anda biasanya harus mengatasi sendiri masalah tersebut (misalnya, dengan melakukan boot ulang instans atau membuat perubahan konfigurasi instans).
catatan
Distribusi Linux terbaru yang digunakan systemd-networkd
untuk konfigurasi jaringan mungkin melaporkan pemeriksaan kesehatan secara berbeda dari distribusi sebelumnya. Selama proses boot, jenis jaringan ini dapat dimulai lebih awal dan berpotensi selesai sebelum tugas startup lainnya yang juga dapat mempengaruhi kesehatan instance. Pemeriksaan status yang bergantung pada ketersediaan jaringan dapat melaporkan status yang sehat sebelum tugas lain selesai.
Berikut adalah contoh masalah yang dapat menyebabkan kegagalan pemeriksaan status instans:
-
Pemeriksaan status sistem gagal
-
Konfigurasi jaringan atau pemulaian salah
-
Memori habis
-
Sistem file rusak
-
Kernel tidak kompatibel
-
Selama reboot, pemeriksaan status instance melaporkan kegagalan hingga instance tersedia lagi.
Jika pemeriksaan status instance gagal, kami menambah metrik StatusCheckFailed_Instance.
Instans bare metal
Jika Anda memulai ulang dari sistem operasi pada instans bare metal, pemeriksaan status instans tersebut mungkin akan kembali ke status gagal untuk sementara. Ketika instans tersedia, pemeriksaan status instans seharusnya kembali ke status lulus.
Pemeriksaan status EBS terlampir
Anda dapat menggunakan pemeriksaan status EBS terlampir untuk memantau apakah volume Amazon EBS yang dilampirkan ke instans dapat dijangkau dan dapat menyelesaikan operasi I/O. Metrik StatusCheckFailed_AttachedEBS
adalah nilai biner yang menunjukkan gangguan jika satu atau lebih volume EBS yang terlampir pada instans tidak dapat menyelesaikan operasi I/O. Pemeriksaan status ini mendeteksi masalah yang mendasari komputasi atau infrastruktur Amazon EBS. Jika metrik pemeriksaan status EBS terlampir gagal, Anda dapat menunggu AWS untuk menyelesaikan masalah, atau Anda dapat mengambil tindakan, seperti mengganti volume yang terpengaruh atau menghentikan dan memulai ulang instance.
Berikut adalah contoh masalah yang dapat menyebabkan kegagalan pemeriksaan status EBS terlampir:
-
Masalah perangkat keras atau perangkat lunak pada subsistem penyimpanan yang mendasari volume EBS
-
Masalah perangkat keras pada host fisik yang memengaruhi jangkauan volume EBS
-
Masalah konektivitas antara instans dan volume EBS
Anda dapat menggunakan metrik StatusCheckFailed_AttachedEBS
untuk membantu meningkatkan ketahanan beban kerja Anda. Anda dapat menggunakan metrik ini untuk membuat CloudWatch alarm Amazon yang dipicu berdasarkan hasil pemeriksaan status. Misalnya, Anda dapat melakukan failover ke instans sekunder atau Zona Ketersediaan saat mendeteksi adanya dampak yang berkepanjangan. Atau, Anda dapat memantau kinerja I/O dari setiap volume yang terpasang menggunakan CloudWatch metrik EBS untuk mendeteksi dan mengganti volume yang terganggu. Jika beban kerja Anda tidak mendorong I/O ke salah satu volume EBS yang dilampirkan pada instans dan pemeriksaan status EBS terlampir menunjukkan adanya gangguan, Anda dapat menghentikan dan memulai instans untuk mengatasi masalah dengan host fisik yang memengaruhi jangkauan volume EBS. Untuk informasi selengkapnya, lihat CloudWatch Metrik Amazon untuk Amazon EBS.
Anda juga dapat mengonfigurasi grup EC2 Auto Scaling Amazon untuk mendeteksi kegagalan pemeriksaan status EBS terlampir, lalu mengganti instans yang terpengaruh dengan yang baru. Untuk informasi selengkapnya, lihat Memantau dan mengganti instans Auto Scaling dengan volume Amazon EBS yang terganggu di Panduan Pengguna Auto Scaling EC2 Amazon.
catatan
Metrik pemeriksaan status EBS yang terlampir hanya tersedia untuk instans Nitro.