AWS Systems Manager Incident Manager とは? - Incident Manager

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Systems Manager Incident Manager とは?

インシデントマネージャー、次の能力AWS Systems Managerは、軽減と回復に役立つように設計されています事件ホストされているアプリケーションへの影響AWS。

の文脈ではAWS、インシデントとは、事業運営に重大な影響を与える可能性のある、サービス品質の計画外の中断または低下のことです。したがって、組織はインシデントを効率的に軽減して回復するための対応戦略を確立し、将来のインシデントを防ぐためのアクションを実行することが重要です。

インシデントマネージャーは、次の方法でインシデント解決までの時間を短縮するのに役立ちます。

  • インシデント対応の責任者を効率的に関与させるための自動計画を提供する。

  • 関連するトラブルシューティングデータを提供します。

  • 定義済みの自動化ランブックを使用して自動応答アクションを有効にする。

  • すべての利害関係者と協力してコミュニケーションをとる方法を提供します。

Incident Managerに組み込まれている機能とワークフローは、Amazonがほぼ創業以来開発してきたインシデント対応のベストプラクティスに基づいています。インシデントマネージャーはそのようなものと統合しますAWS のサービスアマゾンとしてCloudWatch、AWS CloudTrail、AWS Systems Manager、およびアマゾンEventBridge。

主なコンポーネントと機能

このセクションでは、インシデント対応計画の設定に使用するインシデントマネージャーの機能について説明します。

対応計画

対応計画は、インシデント発生時に何が必要かを定義するテンプレートとして機能します。次のような情報が含まれます。

  • インシデントが発生したときに対応する必要があるのは誰か。

  • インシデントを軽減するための自動対応を確立しました。

  • 対応担当者がインシデントに関するコミュニケーションや自動通知の受信に使用しなければならないコラボレーションツールです。

インシデント検知

アマゾンを設定することができますCloudWatchアラームとアマゾンEventBridge自分に影響する状況や変化が発生した場合にインシデントを作成するイベントAWSリソースは検出されます。

ランブックの自動化サポート

Incident Manager 内から自動化ランブックを作成して、インシデントへの重要な対応を自動化し、ファーストレスポンダーに詳細な手順を提供できます。

エンゲージメントとエスカレーション

アンエンゲージメントプラン特定のインシデントが発生するたびに全員に通知するように指定します。インシデントマネージャーに追加した個々の連絡先を指定することも、インシデントマネージャーで作成したオンコールスケジュールを指定することもできます。また、エンゲージメント計画には、関係者がインシデント対応プロセスに積極的に参加できるようにエスカレーションパスも明記されています。

オンコールスケジュール

アンオンコールスケジュールインシデントマネージャーでは、スケジュール用に作成した 1 つ以上のローテーションで構成されます。各ローテーションには、最大 30 個のコンタクトを含めることができます。オンコールスケジュールをエスカレーションプランまたはレスポンスプランに追加すると、対応者の介入が必要なインシデントが発生したときに、誰に通知を受けるかが定義されます。オンコールスケジュールにより、インシデント対応に必要な24時間365日の完全かつ冗長な対応が可能になります。

アクティブなコラボレーション

インシデントレスポンダーは、との統合を通じてインシデントに積極的に対応しますAWS Chatbotクライアント。AWS Chatbotを使用するインシデントマネージャー用のチャットチャネルの作成をサポートしますSlack、Microsoft Teams、またはアマゾンチャイム。対応者は互いに直接連絡を取り合ったり、インシデントに関する自動通知を受け取ったり、SlackそしてMicrosoft Teams—Incident Manager のコマンドラインインターフェイス (CLI) 操作の一部を直接実行します。

インシデント診断

回答者は閲覧できるup-to-dateインシデント発生時のインシデントマネージャーコンソールの情報。情報の変更に基づいて、回答者はフォローアップ項目を作成し、自動化ランブックを使用して修正できます。

インシデント後の分析

インシデントが解決したら、事後分析を使用して、検出や軽減までの時間など、インシデント対応の改善点を特定します。分析は、インシデントの原因を理解するのに役立ちます。インシデントマネージャーは、インシデント対応の改善に役立つ推奨フォローアップアクション項目を作成します。

Incident Manager を使用する利点

インシデントの検出と対応の業務にインシデントマネージャーを使用するメリットについて学んでください。

このセクションでは、インシデントマネージャー対応計画を実施することで組織が得ることができる利点について説明します。

問題を効率的かつ迅速に診断

アマゾンCloudWatchアラームとアマゾンEventBridge設定したイベントにより、サービスの品質が計画外の中断または低下した場合に、自動的にインシデントを作成できます。

CloudWatchアラームは、あるしきい値を基準にして複数の期間にわたって指標または式の値が変化したことを検出して報告します。EventBridgeイベントは、で指定した環境、アプリケーション、またはサービスの変更の結果として作成されます。EventBridge規則。アラームまたはイベントを作成するときに、インシデントマネージャーで作成するインシデントのアクションと、インシデントのエンゲージメント、エスカレーション、軽減を促進するための適切な対応計画を指定できます。

Incident Managerには、次の方法を使用して、インシデントに関連するメトリックを自動的に収集および追跡する機能があります。CloudWatch指標。さらに、インシデントを経由してインシデントを作成すると、そのインシデントに対して自動的に生成されるメトリックもあります。CloudWatchアラーム、リアルタイムで手動でメトリックを追加して、インシデントの対応者に追加のコンテキストとデータを提供できます。

Incident Manager インシデントタイムラインを使用して、POI を時系列で表示します。回答者はタイムラインを使用してカスタムイベントを追加し、自分が何をしたか、何が起こったかを説明することもできます。自動化された POI は次のとおりです。

  • あるCloudWatchアラームまたはEventBridgeルールはインシデントを生成します。

  • インシデントメトリックはインシデントマネージャーに報告されます。

  • レスポンダーが関与しています。

  • Runbook ステップは正常に完了しました。

効果的なエンゲージメント

インシデントマネージャーは、連絡先、オンコールスケジュール、エスカレーションプラン、チャットチャネルを使用して、インシデント対応者をまとめます。Incident Manager で個々の連絡先を直接定義し、連絡先設定 (電子メール、SMS、または音声) を指定します。オンコールスケジュールのローテーションに連絡先を追加して、特定の期間に誰がインシデントに対処するかを決定します。定義した連絡先とオンコールスケジュールを使用して、インシデント発生時に適切なタイミングで必要な対応者を関与させるためのエスカレーションプランを作成します。

リアルタイムでのコラボレーション

インシデント中のコミュニケーションは、より迅速な解決の鍵です。を使用するAWS Chatbot使用するためのクライアント設定Slack、Microsoft Teams、または Amazon Chime では、レスポンダーが好みの接続チャットチャネルに集まり、インシデントや相互に直接やり取りできます。また、インシデントマネージャーはチャットチャネルにインシデント対応者のリアルタイムのアクションを表示し、他のユーザーにコンテキストを提供します。

サービスの自動復元

インシデントマネージャーを使用すると、担当者はオートメーションを使用してインシデントの解決に必要な主要タスクに集中できます。ランブック。インシデントマネージャーでは、ランブックはインシデントを解決するために実行される一連のアクションがあらかじめ定義されています。自動化されたタスクと必要に応じて手動の手順を組み合わせることができるため、対応担当者はより迅速に分析して影響に対応できるようになります。

将来のインシデントを防ぐ

インシデントマネージャーの事後分析を使用すると、チームはより強固な対応計画を立て、アプリケーション全体に変更を加えて、将来のインシデントやダウンタイムを防ぐことができます。インシデント後の分析により、ランブック、対応計画、指標を繰り返し学習して改善することもできます。

インシデントマネージャーは他のいくつかのものと統合されていますAWS のサービスまた、インシデントの検出と解決、APIオペレーションとの間接的なやり取り、インフラストラクチャの管理に役立つサードパーティのサービスとツール。詳細については、「インシデントマネージャーとの製品とサービスの統合」を参照してください。

Incident Manager へのアクセス

Incident Manager には、次のいずれかの方法でアクセスできます。

インシデントマネージャーのリージョンとクォータ

インシデントマネージャーはすべてサポートされていませんAWS リージョンシステムマネージャーによってサポートされています。

インシデントマネージャーのリージョンとクォータに関する情報を表示するには、以下を参照してください。AWS Systems Manager Incident ManagerエンドポイントとクォータAmazon Web Services 全般のリファレンス

Incident Manager の価格

Incident Manager の使用には料金がかかりますか。詳細については、「AWSSystems Manager の料金」を参照してください。

注記

[その他]AWS のサービス、AWS本サービスに関連して提供されるコンテンツおよび第三者のコンテンツには、別途料金が適用される場合があり、追加条件が適用される場合があります。

の概要についてはTrusted Advisor、お客様のコスト、セキュリティ、パフォーマンスの最適化を支援するサービスAWS環境、「」を参照AWS Trusted AdvisorAWS Supportユーザーガイド