AWS Systems Manager Incident Manager とは? - Incident Manager

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Systems Manager Incident Manager とは?

AWS Systems Manager Incident Manager は、AWS-ホストアプリケーションに影響を与えるインシデントを、ユーザーが緩和したりそのようなインシデントから復旧したりできるように設計されたインシデント管理コンソールです。インシデントとは、サービスの品質の計画外の中断または低下です。

Incident Manager は、影響をレスポンダーに通知し、関連するトラブルシューティングデータを強調表示し、サービスをバックアップして実行するためのコラボレーションツールを提供することで、インシデントの解決を向上させます。削減という第一の目的を達成するために time-to-resolution Incident Manager は、重要なインシデントのうち、対応プランを自動化して、レスポンダーチームのエスカレーションを可能にします。

を使用するAWSAmazonなどのツール CloudWatch アラームと CloudWatch メトリクスAWS CloudTrail,AWS Systems Manager,AWS Chatbotなど、Incident Manager は、アプリケーションを再稼働するための迅速なインシデント対応を可能にします。

次の機能があります。

  • 対応計画:によって開始された応答計画を作成し、自動化する CloudWatch のアラーム EventBridge イベント.

  • Runbook オートメーション - Systems Manager オートメーションでランブックを定義して、重要な対応を自動化し、最初の応答者に詳細なステップを提供します。

  • エンゲージメントとエスカレーション - 一意のインシデントごとに正しい人員を自動的に接続します。さまざまなお問い合わせ方法を介して応答者をエスカレートし、インシデント中の可視性と積極的な参加を確実にします。

  • アクティブコラボレーション — インシデント応答者は、AWS Chatbot クライアントとの統合を通じて、インシデントに積極的に対応します。

  • インシデント追跡— インシデントの詳細を確認します。 up-to-date インシデント中の情報 ランブックに沿ってフォローアップ項目を作成し、修正します。

Incident Manager を使用する利点

迅速なアラインメント

Incident Manager は、Amazon を使用して、インシデントに関連するメトリクスを自動的に収集・追跡する機能を提供します CloudWatch メトリクス。

チャットチャネル または Incident Manager インシデントの詳細を使用して、リアルタイムでインシデントに手動でメトリクスを追加できます。組み込みを使用して、メトリクスをさらに調査します CloudWatch グラフ。

Incident Manager インシデントタイムラインを使用して、POI を時系列で表示します。応答者は、タイムラインを使用してカスタムイベントを追加し、自分が何をしたのか、何が起こったのかを説明することもできます。自動化された POI は次のとおりです。

  • メトリクスがアラームになる

  • メトリクスの追加

  • 応答者のエンゲージメント

  • ランブックステップの完了

効果的なコラボレーション

Incident Manager は、連絡先、エスカレーション計画、チャットチャネルを使用して、インシデント応答者をまとめます。Incident Manager で直接、希望する問い合わせチャネルを定義できます。定義された 連絡先 を使用して、インシデント中に適切なタイミングで必要な応答者をエンゲージさせるエスカレーション計画を作成します。

AWS Chatbot クライアントを使用して、インシデントと直接対話できる接続されたチャットチャネルに応答者を集めます。Incident Manager は、チャットチャネル内のインシデント応答者のリアルタイムアクションを表示し、他のユーザーにコンテキストを提供します。インシデント中のコミュニケーションは、より迅速な解決の鍵です。

自動化と改善

Incident Manager では、ランブックを使用することで、応答者はインシデントの解決に必要な主要タスクに集中できます。インシデントを解決するために実行される一連のアクションであるランブックは、自動化されたタスクの能力と手動ステップの詳細を組み合わせて、応答者が影響を分析して対応できるようにします。

Incident Manager による インシデント後分析により、チームはより強固な対応計画を策定し、アプリケーション全体に影響を与えて、今後のインシデントやダウンタイムを防ぐことができます。インシデント後分析は、ランブック、対応計画、およびメトリクスの反復学習と改善も提供します。

Incident Manager は、現在の AWS 環境と統合し、インシデントの迅速な解決を提供します。

  • AWS Chatbot– DevOps チームは、Amazon Chime や Slack のチャットルームを使用して、インシデントのモニタリングや対応を行うことができます。Incident Manager と AWS Chatbotとの連携については、このガイドの コミュニケーション セクションの チャットチャネル を参照してください。

  • AWS CloudFormation — AWS CloudFormation を使用した対応計画の作成の自動化。詳細については、「AWS CloudFormation ユーザーガイド」を参照してください。

  • Amazon CloudWatch— 設定 CloudWatch をクリックして、アプリケーションリソースをモニタリングします。を使用する CloudWatch アラームを使用して、Incident Manager コンソールでインシデントを開始します。モニタリングベストプラクティスの詳細については、「対応計画」を参照してください。インシデントの詳細ページを使用して、インシデント中の詳細なメトリクスを確認します。インシデントの詳細ページのメトリクスの詳細については、このガイドの「インシデントの詳細」の メトリクス を参照してください。

  • AWS Systems Manager - Systems Manager の機能を使用して、アプリケーションインフラストラクチャの表示と制御ができます。詳細については、Systems Manager ユーザーガイドを参照してください。

    • OpsCenter — インシデント後分析から直接 OpsItems を作成し、関連する作業をフォローアップすることができます。Incident Manager インシデント後分析を使用した継続的な改善の詳細については、このガイドの「インシデント後分析」セクションを参照してください。

    • オートメーション — Systems Manager オートメーションを使用したランブックの作成については、このガイドの「ランブックと自動化」セクションを参照してください。

Incident Manager へのアクセス

Incident Manager には、次のいずれかの方法でアクセスできます。

Incident Manager のリージョンとクォータ

Incident Manager は、Systems Manager のすべてのリージョンでサポートされているわけではありません。

Incident Manager のリージョンとクォータに関する情報を表示するには、「Amazon Web Services 一般リファレンスガイド」の「Incident Manager エンドポイント とクォータ」を参照してください。

Incident Manager の価格

Incident Manager の使用には料金がかかりますか。詳細については、「AWSSystems Manager の料金」を参照してください。

このサービスに関連して提供される他の AWS サービス、AWS コンテンツ、およびサードパーティーコンテンツには、別途料金がかかり、追加条件が適用される場合があります。