AWS Systems Manager Incident Manager とは? - Incident Manager

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Systems Manager Incident Manager とは?

AWS Systems Manager Incident Manager は、AWS-ホストアプリケーションに影響を与えるインシデントを、ユーザーが緩和したりそのようなインシデントから復旧したりできるように設計されたインシデント管理コンソールです。インシデントとは、サービスの品質の計画外の中断または低下です。

Incident Manager は、影響をレスポンダーに通知し、関連するトラブルシューティングデータを強調表示し、サービスをバックアップして実行するためのコラボレーションツールを提供することで、インシデントの解決に要する時間を短縮します。Incident Manager は、 time-to-resolution 重要なインシデントの削減という主な目標を達成するために、対応プランを自動化して、レスポンダーチームがエスカレーションできるようにします。

Incident Manager は、Amazon CloudWatch CloudWatch アラームやメトリクスAWS CloudTrail、AWS Systems Manager、AWS Chatbot、、などのAWSツールを使用して、アプリケーションを再稼働させるための迅速なインシデント対応を可能にします。

次の機能があります。

  • 対応計画 — CloudWatch アラームまたは Amazon EventBridge イベントによって開始される対応計画を作成して自動化します。

  • Runbook オートメーション - Systems Manager オートメーションでランブックを定義して、重要な対応を自動化し、最初の応答者に詳細なステップを提供します。

  • エンゲージメントとエスカレーション - 一意のインシデントごとに正しい人員を自動的に接続します。さまざまなお問い合わせ方法を介して応答者をエスカレートし、インシデント中の可視性と積極的な参加を確実にします。

  • アクティブコラボレーション — インシデント応答者は、AWS Chatbot クライアントとの統合を通じて、インシデントに積極的に対応します。

  • インシデント追跡- up-to-date インシデント中の情報については、インシデントの詳細を確認します。ランブックに沿ってフォローアップ項目を作成し、修正します。

Incident Manager を使用する利点

迅速なアラインメント

Incident Manager は、Amazon メトリクスを使用して、 CloudWatch インシデントに関連するメトリクスを自動的に収集・追跡する機能を提供します。

チャットチャネル または Incident Manager インシデントの詳細を使用して、リアルタイムでインシデントに手動でメトリクスを追加できます。 CloudWatch 組み込みグラフを使用して、メトリクスをさらに調査します。

Incident Manager インシデントタイムラインを使用して、POI を時系列で表示します。応答者は、タイムラインを使用してカスタムイベントを追加し、自分が何をしたのか、何が起こったのかを説明することもできます。自動化された POI は次のとおりです。

  • メトリクスがアラームになる

  • メトリクスの追加

  • 応答者のエンゲージメント

  • ランブックステップの完了

効果的なコラボレーション

Incident Manager は、連絡先、エスカレーション計画、チャットチャネルを使用して、インシデント応答者をまとめます。Incident Manager で直接、希望する問い合わせチャネルを定義できます。定義された 連絡先 を使用して、インシデント中に適切なタイミングで必要な応答者をエンゲージさせるエスカレーション計画を作成します。

AWS Chatbot クライアントを使用して、インシデントと直接対話できる接続されたチャットチャネルに応答者を集めます。Incident Manager は、チャットチャネル内のインシデント応答者のリアルタイムアクションを表示し、他のユーザーにコンテキストを提供します。インシデント中のコミュニケーションは、より迅速な解決の鍵です。

自動化と改善

Incident Manager では、ランブックを使用することで、応答者はインシデントの解決に必要な主要タスクに集中できます。インシデントを解決するために実行される一連のアクションであるランブックは、自動化されたタスクの能力と手動ステップの詳細を組み合わせて、応答者が影響を分析して対応できるようにします。

Incident Manager による インシデント後分析により、チームはより強固な対応計画を策定し、アプリケーション全体に影響を与えて、今後のインシデントやダウンタイムを防ぐことができます。インシデント後分析は、ランブック、対応計画、およびメトリクスの反復学習と改善も提供します。

Incident Manager は、現在の AWS 環境と統合し、インシデントの迅速な解決を提供します。

  • AWS Chatbot— DevOps チームは、Amazon Chime や Slack のチャットルームを使用して、インシデントのモニタリングや対応を行うことができます。Incident Manager と AWS Chatbotとの連携については、このガイドの コミュニケーション セクションの インシデントマネージャーでのチャットチャネルの操作 を参照してください。

  • AWS CloudFormation — AWS CloudFormation を使用した対応計画の作成の自動化。詳細については、AWS CloudFormation ユーザーガイドを参照してください。

  • Amazon CloudWatch — CloudWatch アプリケーションリソースを監視するように設定します。 CloudWatch アラームを使用して、Incident Manager コンソールでインシデントを開始します。モニタリングベストプラクティスの詳細については、「Incident Manager での対応計画の使用」を参照してください。インシデントの詳細ページを使用して、インシデント中の詳細なメトリクスを確認します。インシデントの詳細ページのメトリクスの詳細については、このガイドの「インシデントの詳細」の メトリクス を参照してください。

  • AWS Systems Manager - Systems Manager の機能を使用して、アプリケーションインフラストラクチャの表示と制御ができます。詳細については、AWS Systems Manager ユーザーガイドを参照してください。

Incident Manager へのアクセス

Incident Manager には、次のいずれかの方法でアクセスできます。

Incident Manager のリージョンとクォータ

Incident Manager は、Systems ManagerAWS リージョン のすべてのサポートでサポートされているわけではありません。

Incident Manager のリージョンとクォータに関する情報を表示するには、「Amazon Web Services 一般リファレンス」の「AWS Systems Manager Incident Managerエンドポイントとクォータ」を参照してください。

Incident Manager の価格

Incident Manager の使用には料金がかかりますか。詳細については、「AWSSystems Manager の料金」を参照してください。

AWSこのサービスに関連して提供される他のサービス、AWSコンテンツ、およびサードパーティーコンテンツには、別途料金がかかり、追加条件が適用される場合があります。