Detail insiden - Incident Manager

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Detail insiden

Halaman detail Insiden memberikan wawasan dan alat terperinci yang dapat Anda gunakan untuk mengelola insiden. Dari halaman ini, Anda dapat memulai runbook untuk mengurangi insiden, menambahkan catatan insiden, melibatkan penyelesai lain, dan melihat detail insiden seperti garis waktu, metrik, properti, dan sumber daya terkait. Halaman detail Insiden mencakup bagian berikut: Spanduk teratas, Catatan insiden, dan tujuh tab yang berisi informasi dan sumber daya tambahan. Secara default, bagian Spanduk teratas dan catatan Insiden ditampilkan di semua halaman detail Insiden.

Halaman detail Insiden mencakup 7 tab dengan informasi yang terkait dengan suatu insiden.

Topik ini menjelaskan elemen halaman Detail insiden dan tindakan yang dapat Anda lakukan dari halaman.

Spanduk teratas

Spanduk teratas di setiap halaman detail insiden mencakup informasi berikut:

  • Status — Status saat ini dari suatu insiden dapat Terbuka atau Terselesaikan.

  • Dampak — Dampak insiden terhadap lingkungan Anda. Bisa tinggi, sedang, dan rendah. Untuk mengubah dampak insiden, pilih Edit properti.

  • Saluran obrolan — Tautan untuk mengakses saluran obrolan tempat Anda dapat melihat pembaruan dan pemberitahuan insiden.

  • Durasi — Jumlah waktu yang berlalu sebelum responden menyelesaikan insiden tersebut.

  • Runbook — Status untuk runbook yang terkait dengan insiden ini. Status dapat menunggu masukan, berhasil, atau tidak berhasil. Jika status runbook menunggu masukan, Anda dapat memilih runbook untuk melihat detail tindakan. Anda dapat memilih gagal untuk melihat runbook yang Timed out, Gagal, atau Dibatalkan.

  • Keterlibatan — Jumlah total keterlibatan dan status setiap keterlibatan. Saat Anda membuat keterlibatan, statusnya Terlibat. Setelah Anda mengakui keterlibatan, status berubah dari Terlibat menjadi Diakui. Manajer Insiden tidak mendukung pengakuan keterlibatan pihak ketiga. Keterlibatan tersebut tetap dalam status Terlibat.

Anda dapat mengedit judul insiden, dampak, dan saluran obrolan dengan memilih Edit di sudut kanan atas spanduk.

Catatan insiden

Sisi kanan layar menampilkan bagian Catatan insiden. Dengan catatan, Anda dapat berkolaborasi dan berkomunikasi dengan pengguna lain yang mengerjakan suatu insiden. Anda dapat menjelaskan mitigasi yang Anda terapkan, akar penyebab potensial yang Anda identifikasi, atau status insiden saat ini. Sebagai praktik terbaik, gunakan bagian Catatan insiden untuk memposting pembaruan status dan tindakan yang Anda atau orang lain lakukan pada suatu insiden. Jika Anda perlu berkomunikasi dengan resolver lain secara real time, gunakan saluran obrolan yang tersedia di Manajer Insiden.

Untuk menambahkan catatan, pilih tombol Tambahkan catatan kejadian, lalu masukkan catatan Anda. Catatan dapat berisi pembaruan tentang status insiden atau informasi relevan lainnya yang memberikan visibilitas kepada pengguna lain. Jika diperlukan, Anda juga dapat mengedit atau menghapus catatan insiden.

catatan

Setiap pengguna dengan izin IAM untuk menjalankan ssm-incidents:UpdateTimelineEvent dan ssm-incidents:DeleteTimelineEvent tindakan dapat mengedit dan menghapus catatan. Namun, saat Anda membagikan insiden dengan akun lain, kebijakan sumber daya tidak menyertakan ssm-incidents:DeleteTimelineEvent tindakan tersebut. Ini mencegah pengguna yang berbagi insiden dengan Anda menghapus catatan. Anda dapat melihat jejak audit untuk catatan dari peristiwa Manajer Insiden di AWS CloudTrail konsol.

Tab

Halaman detail insiden memiliki tujuh tab, sehingga memudahkan responden untuk menemukan dan melihat informasi selama insiden. Tab menampilkan penghitung di nama tab, yang menunjukkan jumlah pembaruan pada tab. Untuk informasi lebih lanjut tentang isi setiap tab serta tindakan yang tersedia, lanjutkan membaca.

Gambaran Umum

Tab Ikhtisar adalah halaman arahan untuk responden. Ini berisi ringkasan insiden, daftar peristiwa timeline terbaru, dan langkah runbook saat ini.

Responden menggunakan Ringkasan untuk menangkap tindakan apa yang telah diambil, hasil dari setiap perubahan, kemungkinan langkah selanjutnya, dan informasi tentang dampak insiden tersebut. Untuk memperbarui ringkasan, pilih Edit di sudut kanan atas bagian Ringkasan.

penting

Jika beberapa responden mengedit bidang ringkasan secara bersamaan, responden yang mengirimkan hasil editannya terakhir akan menimpa semua input lainnya.

Bagian peristiwa timeline terbaru berisi garis waktu yang diisi oleh Manajer Insiden dengan lima peristiwa terbaru. Gunakan bagian ini untuk memahami status insiden dan apa yang baru-baru ini terjadi. Untuk melihat timeline lengkap, lanjutkan ke tab Timeline.

Halaman ikhtisar juga menampilkan langkah runbook saat ini. Langkah ini mungkin merupakan langkah otomatis yang berjalan di AWS lingkungan Anda, atau mungkin serangkaian instruksi manual untuk responden. Untuk melihat runbook lengkap, termasuk langkah sebelumnya dan yang akan datang, pilih tab Runbook.

Diagnosis

Tab Diagnosis berisi informasi penting tentang aplikasi dan sistem yang Anda AWS hosting, termasuk informasi tentang metrik dan, jika diaktifkan, temuan.

Bekerja dengan metrik

Manajer Insiden menggunakan Amazon CloudWatch untuk mengisi metrik dan grafik alarm yang ditemukan di tab ini. Untuk mempelajari lebih lanjut tentang praktik terbaik manajemen insiden untuk mendefinisikan alarm dan metrik, lihat Pemantauan di bagian Perencanaan insiden di panduan pengguna ini.

Untuk menambahkan metrik
  • Pilih Tambahkan di sudut kanan atas tab ini.

    • Untuk menambahkan metrik dari CloudWatch dasbor yang ada, pilih Dari CloudWatch dasbor yang ada.

      1. Pilih Dasbor. Ini menambahkan semua metrik dan alarm yang merupakan bagian dari dasbor yang dipilih.

      2. (Opsional) Anda juga dapat Memilih metrik dari dasbor untuk melihat metrik tertentu.

    • Tambahkan satu metrik dengan memilih Dari CloudWatch dan menempelkan sumber metrik. Untuk menyalin sumber metrik:

      1. Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/.

      2. Di panel navigasi, pilih Metrik.

      3. Pada tab Semua metrik, masukkan istilah pencarian di bidang pencarian, seperti nama metrik atau nama sumber daya, dan pilih Enter.

        Misalnya, jika Anda mencari CPUUtilization metrik, Anda akan melihat ruang nama dan dimensi yang terkait dengan metrik ini.

      4. Pilih salah satu hasil dari penelusuran Anda untuk melihat metrik.

      5. Pilih tab Sumber dan salin sumbernya.

Grafik alarm metrik hanya dapat ditambahkan ke detail insiden melalui rencana respons terkait, atau dengan memilih Dari CloudWatch dasbor yang ada saat menambahkan metrik.

Untuk menghapus metrik, pilih Hapus, lalu pilih metrik yang ingin Anda hapus dari dropdown Metrik yang disediakan.

Melihat temuan dari AWS CodeDeploy dan AWS CloudFormation

Setelah Temuan diaktifkan dan semua izin yang diperlukan dikonfigurasi, temuan apa pun yang mungkin terkait dengan insiden tertentu dilampirkan pada insiden tersebut. Responden dapat melihat informasi tentang temuan ini di halaman Detail insiden.

Untuk melihat temuan dari CodeDeploy dan CloudFormation
  1. Buka konsol Manajer Insiden.

  2. Pilih nama insiden untuk diselidiki.

  3. Pada tab Diagnosis, di area Temuan, bandingkan waktu mulai dari temuan yang dilaporkan dengan waktu mulai kejadian.

  4. Untuk melihat detail lebih lanjut tentang temuan, di kolom Referensi, pilih tautan ke CodeDeploy atau CloudFormation temuan.

Garis Waktu

Gunakan tab Timeline untuk melacak peristiwa yang terjadi selama insiden. Manajer Insiden secara otomatis mengisi peristiwa timeline yang mengidentifikasi kejadian signifikan selama insiden tersebut. Responden dapat menambahkan peristiwa khusus berdasarkan kejadian yang terdeteksi secara manual. Selama analisis pasca-insiden, tab timeline memberikan wawasan berharga tentang bagaimana mempersiapkan dan menanggapi insiden dengan lebih baik di masa depan. Untuk informasi lebih lanjut tentang analisis pasca-insiden, lihatMelakukan analisis pasca insiden Incident Manager Incident Manager Incident Manager.

Untuk menambahkan acara timeline kustom, pilih Tambah. Pilih tanggal menggunakan kalender, lalu masukkan waktu. Semua waktu ditampilkan di zona waktu lokal Anda. Berikan deskripsi singkat tentang peristiwa yang muncul di timeline.

Untuk mengedit acara kustom yang ada, pilih acara di timeline dan pilih Edit. Anda dapat mengubah waktu, tanggal, dan deskripsi acara khusus. Anda hanya dapat mengedit acara khusus.

Runbook

Tab Runbooks pada halaman detail insiden adalah tempat responden dapat melihat langkah-langkah runbook dan memulai runbook baru.

Untuk memulai runbook baru, pilih Mulai runbook di bagian Runbooks. Gunakan kolom pencarian untuk menemukan runbook yang ingin Anda mulai. Berikan Parameter yang diperlukan dan Versi runbook yang ingin Anda gunakan saat memulai runbook. Runbook yang dimulai selama insiden dari tab Runbooks menggunakan izin akun yang saat ini masuk.

Untuk menavigasi ke definisi runbook di Systems Manager, pilih judul runbook di bawah Runbooks. Untuk menavigasi ke instance runbook yang sedang berjalan di Systems Manager, pilih detail eksekusi di bawah Rincian eksekusi. Halaman-halaman ini menampilkan template yang digunakan untuk memulai runbook dan detail spesifik dari contoh dokumen otomatisasi yang sedang berjalan.

Bagian langkah Runbook menampilkan daftar langkah yang secara otomatis diambil oleh runbook yang dipilih atau dilakukan responden secara manual. Langkah-langkah berkembang saat mereka menjadi langkah saat ini, menampilkan informasi yang diperlukan untuk menyelesaikan langkah, atau rincian tentang apa yang dilakukan langkah tersebut. Langkah-langkah runbook otomatis diselesaikan setelah otomatisasi selesai. Langkah-langkah manual mengharuskan responden untuk memilih Langkah berikutnya di bagian bawah setiap langkah. Setelah langkah selesai, output langkah muncul sebagai dropdown.

Untuk membatalkan eksekusi runbook, pilih Batalkan runbook. Ini akan menghentikan eksekusi runbook dan tidak menyelesaikan langkah lebih lanjut di runbook.

Keterlibatan

Tab Keterlibatan pada detail insiden mendorong keterlibatan responden dan tim. Dari tab ini, Anda dapat melihat siapa yang telah terlibat, siapa yang telah merespons, serta responden mana yang akan terlibat sebagai bagian dari rencana eskalasi. Responden dapat melibatkan kontak lain langsung dari tab ini. Untuk mempelajari lebih lanjut tentang membuat rencana kontak dan eskalasi, lihat bagian Bekerja dengan kontak di Insiden Manager dan Bekerja dengan rencana eskalasi di Incident Manager bagian dari panduan ini.

Anda dapat mengonfigurasi rencana respons dengan kontak dan rencana eskalasi untuk memulai keterlibatan secara otomatis di awal insiden. Untuk mempelajari lebih lanjut tentang mengonfigurasi rencana respons, lihat Bekerja dengan rencana respons di Manajer Insiden bagian panduan ini.

Anda dapat menemukan informasi tentang setiap kontak di tabel. Tabel ini mencakup informasi berikut:

  • Nama - Tautan ke halaman detail kontak yang menampilkan metode kontak dan rencana keterlibatan mereka.

  • Rencana eskalasi — Tautan ke rencana eskalasi yang melibatkan kontak.

  • Sumber kontak - Mengidentifikasi layanan yang melibatkan kontak ini, seperti AWS Systems Manager atau PagerDuty.

  • Terlibat — Menampilkan kapan rencana melibatkan kontak, atau kapan harus melibatkan kontak sebagai bagian dari rencana eskalasi.

  • Diakui - Menampilkan apakah kontak mengakui keterlibatan.

Untuk mengakui keterlibatan, responden dapat melakukan salah satu hal berikut:

  • Panggilan telepon — Masuk 1 saat diminta.

  • SMS — Membalas pesan dengan kode yang disediakan, atau masukkan kode yang disediakan pada tab Keterlibatan insiden.

  • Email — Masukkan kode yang disediakan di tab Keterlibatan insiden.

Tab Item terkait digunakan untuk mengumpulkan sumber daya yang terkait dengan mitigasi insiden. Sumber daya ini dapat berupa ARN, tautan ke sumber daya eksternal, atau file yang diunggah ke bucket Amazon S3. Tabel menampilkan judul deskriptif dan baik ARN, link, atau rincian bucket. Sebelum menggunakan bucket S3, tinjau Praktik Terbaik Keamanan untuk Amazon S3 di Panduan Pengguna Amazon S3.

Saat mengunggah file ke bucket Amazon S3, pembuatan versi diaktifkan atau ditangguhkan pada bucket tersebut. Saat pembuatan versi diaktifkan di bucket, file yang diunggah dengan nama yang sama dengan file yang ada ditambahkan sebagai versi baru file. Jika pembuatan versi ditangguhkan, file yang diunggah dengan nama yang sama dengan file yang ada menimpa file yang ada. Untuk mempelajari lebih lanjut tentang pembuatan versi, lihat Menggunakan pembuatan versi di bucket S3 di Panduan Pengguna Amazon S3.

Saat menghapus item terkait file, file akan dihapus dari insiden tetapi tidak dihapus dari bucket Amazon S3. Untuk mempelajari lebih lanjut tentang menghapus objek dari bucket Amazon S3, lihat Menghapus objek Amazon S3 di Panduan Pengguna Amazon S3.

Sifat-sifat

Tab Properties memberikan rincian berikut tentang insiden tersebut.

Di bagian Properti insiden, Anda dapat melihat yang berikut:

  • Status — Menjelaskan status insiden saat ini. Insiden tersebut dapat dibuka atau diselesaikan.

  • Waktu mulai — Waktu ketika insiden dibuat di Manajer Insiden.

  • Waktu yang diselesaikan — Waktu insiden diselesaikan di Manajer Insiden.

  • Nama Sumber Daya Amazon (ARN) — ARN dari insiden tersebut. Gunakan ARN saat mereferensikan insiden dari obrolan atau perintah dengan AWS Command Line Interface ()AWS CLI.

  • Rencana Respons - Mengidentifikasi rencana respons untuk insiden yang dipilih. Memilih rencana respons membuka halaman detail rencana respons.

  • Induk OpsItem — Mengidentifikasi yang OpsItem dibuat sebagai induk dari insiden tersebut. Orang tua OpsItem dapat memiliki beberapa insiden terkait dan item tindakan tindak lanjut. Memilih induk OpsItem membuka halaman OpsItems detail di OpsCenter.

  • Analisis — Mengidentifikasi analisis yang dibuat dari insiden ini. Buat analisis dari insiden yang diselesaikan untuk meningkatkan proses respons insiden Anda. Pilih analisis untuk membuka halaman detail analisis.

  • Pemilik — Akun tempat insiden itu dibuat.

Di bagian Tag, Anda dapat melihat dan mengedit kunci tag dan nilai yang terkait dengan catatan insiden. Untuk informasi selengkapnya tentang tag di Manajer Insiden, lihatMenandai sumber daya di Insiden Manager.