AWS Systems Manager OpsCenter - AWS Systems Manager

AWS Systems Manager OpsCenter

AWS Systems Manager の一機能である OpsCenter により、オペレーションエンジニアや IT プロフェッショナルは AWS リソースに関連した運用作業項目 (OpsItems) の表示、調査、解決を一元的に行えます。OpsCenter は、AWS リソースに影響を与える問題の解決までの平均時間を短縮するように設計されています。この Systems Manager の機能では、各 OpsItem、関連する OpsItems、関連リソースに関するコンテキスト調査データを提供しながら、サービス全体で OpsItems を集約および標準化します。OpsCenter には Systems Manager Automation ランブックも用意されており、問題をすばやく解決できます。検索可能なカスタムデータを OpsItem ごとに指定することができます。OpsItems に関する自動的に生成された概要レポートは、ステータスおよびソース別に表示することもできます。

OpsCenter は Amazon EventBridge および Amazon CloudWatch と統合されています。つまり、CloudWatch アラームが ALARM 状態になったとき、または EventBridge がイベントを発行する AWS のサービスからのイベントを処理するときに、OpsCenter で OpsItem を自動的に作成するようにこれらのサービスを設定できます。CloudWatch アラームと EventBridge イベントが自動的に OpsItems を作成するように構成すると、1 つのコンソールから AWS リソースに関する問題を迅速に診断および修正できます。

問題の診断に役立つように、各 OpsItems には、OpsItems を生成した AWS リソースの名前と ID、アラームまたはイベントの詳細、アラーム履歴、アラームタイムライングラフなど、状況に応じた関連情報が含まれています。

オペレーションエンジニアや IT プロフェッショナルは、AWS Systems Manager コンソールの OpsCenter ページ、パブリック API オペレーション、AWS Command Line Interface (AWS CLI)、AWS Tools for Windows PowerShell、または AWS SDK を使用して OpsItems を作成、表示、および編集できます。OpsCenter パブリック API オペレーションを使用すると、OpsCenter をケース管理システムおよび正常性ダッシュボードと統合することもできます。

OpsCenter 統合

次の表に、OpsCenter が AWS の他のサービスおよび Systems Manager 機能と統合する方法について説明します。OpsCenter は、これらのサービスおよび機能と統合されている場合、1 つのコンソールから AWS リソースに関する問題を迅速に診断および修復するのに役立ちます。

サービスや機能 詳細 詳細については

EventBridge

システムがイベントを発行する AWS のサービスからのイベントを処理するときに、OpsCenter で OpsItem を自動的に作成するように Amazon EventBridge を設定できます。次のリストには、OpsItems を作成するために設定できる EventBridge ルールの種類を示します。

  • AWS Security Hub: セキュリティアラートが発行されました

  • Amazon DynamoDB: スロットリングイベント

  • Amazon EC2 Auto Scaling: インスタンスの起動に失敗しました

  • Systems Manager: オートメーションを実行できませんでした

  • AWS Health: スケジュールされたメンテナンスのアラート

  • Amazon Elastic Compute Cloud (Amazon EC2): インスタンスの状態の Running から Stopped への変更

問題を診断に役立つように、各 OpsItem には、OpsItem を生成した AWS リソースの名前と ID、イベントの詳細など、イベントに関する文脈に応じた関連情報が含まれています。

特定のイベントで OpsItems が自動的に作成されるように EventBridge を設定する

CloudWatch

CloudWatch アラームが ALARM 状態になったときに、OpsCenter で OpsItem が自動的に作成されるように Amazon CloudWatch を設定できます。次のリストは、OpsItems を作成する CloudWatch アラームを設定することができる AWS リソースとメトリクスのタイプを示しています。

  • DynamoDB: データベースの読み取りおよび書き込みアクションがしきい値に達する

  • Amazon EC2: CPU 使用率がしきい値に達する

  • AWS Billing and Cost Management: 推定請求額がしきい値に達する

  • Amazon EC2: インスタンスがステータスチェックに失敗する

  • Amazon Elastic Block Store (Amazon EBS): ディスク領域の使用率がしきい値に達する

問題の診断に役立つように、各 OpsItems には、OpsItems を生成した AWS リソースの名前と ID、アラームの詳細、アラーム履歴、アラームタイムライングラフなど、アラームに関する状況に応じた関連情報が含まれています。

アラームから OpsItems を作成するように CloudWatch を設定する

Incident Manager

Systems Manager の一機能である AWS Incident Manager は、AWS でホストされたアプリケーションに影響を与えるインシデントを軽減し、回復するのに役立つインシデント管理コンソールを提供します。インシデントとは、サービスの品質の計画外の中断または低下です。Incident Manager をセットアップして設定すると、Incident Manager でインシデントが作成する際に、システムは OpsCenter に自動的に OpsItems を作成します。OpsItem にインシデントを手動で追加することもできます。

インシデントが解決されたら、インシデント後の分析により、インシデントへの対応を改善するための改善点を特定し、検出結果に対処するためのアクションアイテムを推奨する手順が示されます。インシデントなどの重大度の高いオペレーション上の問題では、OpsCenter で OpsItem を作成すると、オペレーターはインシデント、分析、およびアクション項目の詳細を確認できます。この包括的なビューにより、解決までの時間が短縮され、将来発生する同様の問題を軽減できます。

OpsCenter で Incident Manager インシデントを操作する

AWS Systems Manager Incident Manager ユーザーガイド

CloudWatch Application Insights for .NET and SQL Server

OpsCenter は、.NET および SQL Server 用の CloudWatch Application Insights とも統合されています。CloudWatch Application Insights は、他のアプリケーションリソースとともに Amazon EC2 インスタンスを使用するアプリケーションをモニタリングするのに役立ちます。この機能は、アプリケーションリソースとテクノロジースタック全体の主要なメトリクス、ログ、アラームを識別して設定します。この機能では、検出された問題の自動ダッシュボードも作成されます。ダッシュボードには、エラーの根本原因を特定するのに役立つ相関メトリクスの異常、ログエラー、およびその他の情報が含まれています。CloudWatch Application Insights でアプリケーションリソースを設定する場合、問題が検出されたときにシステムが OpsCenter に OpsItems を作成するように選択できます。

Amazon CloudWatch ユーザーガイドでのアプリケーションのセットアップ

OpsItem を自動的に生成する各 AWS リソースについて、OpsCenterは、AWS Config、AWS CloudTrail ログ、および EventBridge からの情報を集約します。そのため、調査中に複数のコンソールページを移動する必要はありません。

OpsCenter が組織にもたらすメリットは何ですか?

OpsCenter では、AWS リソースに関する問題を表示、対応、修正するための統一された標準エクスペリエンスを提供します。統一された標準エクスペリエンスによって、問題の解決やその問題の調査、新しいオペレーションエンジニアと IT プロフェッショナルのトレーニングにかかる時間は短縮されます。また、統一された標準エクスペリエンスでは、問題を管理して修正するシステムに対する手動エラーの数が低下します。

具体的には、OpsCenter は、オペレーションエンジニアや組織にとって、次のような利点があります。

  • AWS リソースに関連する OpsItems を表示、調査、解決するために、複数のコンソールページを移動する必要はなくなりました。OpsItems は、サービス全体で一元的な場所に集約されます。

  • CloudWatch アラーム、EventBridge イベント、および .NET および SQL Server 用の CloudWatch Application Insights によって自動的に生成される OpsItems のサービス固有のデータおよびコンテキストに関連するデータを表示できます。

  • OpsItem に関するリソースの Amazon リソースネーム (ARN) を指定することができます。関連リソースを指定することで、OpsCenter は、組み込みロジックを使用して、OpsItems が重複しないようにします。

  • 同様の OpsItems の詳細や解決方法に関する情報を確認することができます。

  • 問題を解決するには、Systems Manager Automation ランブック に関する情報をすばやく表示して実行します。

OpsCenter の特徴は何ですか?

  • OpsItem の自動作成と手動作成

    OpsCenter は Amazon CloudWatch と統合されています。つまり、アラームが ALARM 状態になったとき、または Amazon EventBridge がイベントを発行する AWS のサービスからのイベントを処理するときに、OpsCenter で OpsItem を自動的に作成するように CloudWatch を設定できます。手動で OpsItems を作成することもできます。

    OpsCenter は、.NET および SQL Server 用の Amazon CloudWatch Application Insights とも統合されています。つまり、アプリケーションで検出された問題に対して自動的に OpsItems を作成できます。

  • 詳細かつ検索可能な OpsItems

    各 OpsItem には、情報の複数のフィールドを含みます。例えば、OpsItems のタイトル、ID、優先度、説明のほか、最終更新日時などがあります。各 OpsItem には、次の設定可能な機能も含まれます。

    • ステータス: Open、In progress、Resolved、または Open and In progress。

    • 関連リソース: 関連リソースは、影響を受けるリソース、または OpsItem を作成した EventBridge イベントを開始したリソースです。各 OpsItem には、[関連リソース] セクションを含みます。OpsCenter によって、関連リソースの Amazon リソースネーム (ARN) が自動的に表示されます。また、関連リソースの ARN を手動で指定することもできます。一部の ARN タイプでは、その情報を表示するために他のコンソールページにアクセスしなくても、OpsCenter によって、リソースに関する詳細を表示するディープリンクが自動的に作成されます。例えば、EC2 インスタンスの ARN を指定すると、OpsCenter のそのインスタンスに関する EC2 提供の詳細をすべて表示できます。その他の関連リソースの ARN は手動で追加することができます。各 OpsItem セクションには、最大 100 個の関連リソースの ARN が表示されます。詳細については、「」を参照してください関連リソースの使用

    • 関連および同様の OpsItems: 関連 OpsItems 機能を使用すると、現在の OpsItem に何らかの点で関連する OpsItems の ID を指定できます。[同様の OpsItem] 機能によって、OpsItem のタイトルや説明が自動的に確認されてから、関連する、またはその他のユーザー向けの他の OpsItems が一覧表示されます。

    • 検索可能でプライベートな運用データ: 運用データは、OpsItem に関する有用なリファレンスの詳細を提供するカスタムデータです。たとえば、ログファイル、エラー文字列、ライセンスキー、トラブルシューティングのヒント、その他の関連データを指定することができます。キーと値のペアで、運用データを入力します。キーの最大長は 128 文字です。値の最大サイズは 20 KB です。

      このカスタムデータは検索可能ですが、制限があります。[Searchable operational data (検索可能な運用データ)] 機能で、(DescribeOpsItems API オペレーションによって提供される) OpsItem の概要ページにアクセスできるユーザーは誰でも、指定されたデータを表示および検索することができます。[Private operational data (プライベートな運用データ)] 機能で、データは、(GetOpsItem API オペレーションと同様) OpsItem にアクセスできるユーザーのみが表示できます。

    • 重複排除: 関連リソースを指定することで、OpsCenter は、組み込みロジックを使用して、OpsItems が重複しないようにします。さらに、EventBridge でイベントから自動的に作成された OpsItems には、重複 OpsItems の数を減らすための重複排除文字列が含まれています。詳細については、「」を参照してください重複した OpsItems を減らす

  • ランブックを使用した簡単な修復

    各 OpsItems には、AWS リソースに関する一般的な問題を自動的に修正するために使用できる Systems Manager Automation ランブックのリストを含む [ランブック] セクションが含まれています。OpsItem を開き、その OpsItem の AWS リソースを選択し、コンソールで [Run automation (オートメーションを実行)] ボタンを選択すると、OpsCenter に OpsItem を生成した AWS リソースで実行できる Automation ランブックのリストが表示されます。OpsItem から Automation ランブックを実行したら、ランブックは、将来の参照を目的として、OpsItem の関連リソースに自動的に関連付けられます。さらに、OpsCenter を使用して EventBridge で OpsItem ルールを自動的に設定する場合は、一般的なイベントのランブックは、EventBridge によって自動的に関連付けられます。OpsCenter は、特定の OpsItem に対して実行された Automation ランブックの記録を 30 日間保持します。詳細については、「」を参照してくださいSystems Manager Automation を使用して OpsItem 問題を修復する

  • 変更通知: OpsItem が変更または編集されたときはいつでも、Amazon Simple Notification Service (SNS) トピックの ARN を指定して通知を発行できます。SNSトピックは、OpsItem と同じ AWS リージョン に存在する必要があります。

  • 包括的な OpsItem 検索機能 : OpsCenter には、OpsItems をすばやく見つけるのに役立つ複数の検索オプションが用意されています。検索方法の例は次のとおりです: ランブック実行の OpsItem ID、タイトル、最終更新日時、オペレーションデータ値、ソース、および Automation ID など。検索結果を絞り込むには、ステータスフィルターを使用します。

  • OpsItem 概要レポート

    OpsCenter には、概要レポートページが含まれており、次のセクションが自動的に表示されます。

    • ステータスサマリー: OpsItems の概要 (ステータス別: Open、In progress、Resolved、Open and In progress)。

    • 最もオープンな OpsItem を持つソース: OpsItems がオープンになっている上位の AWS のサービスの内訳。

    • ソースと年齢別の OpsItems: ソースと作成後の経過日数別にグループ化された OpsItems の数。

    OpsCenter 概要レポートの表示の詳細については、「OpsCenter の概要レポートを表示する」を参照してください。

  • IAM アクセスコントロール

    AWS Identity and Access Management (IAM) ポリシーを使用することで、OpsItems を作成、表示、一覧表示、更新できる組織のメンバーを制御できます。また、タグを OpsItems に割り当ててから、タグに基づきユーザーおよびグループにアクセス権を付与する IAM ポリシーを作成します。詳細については、「」を参照してくださいOpsCenter の開始方法

  • ログ記録および監査機能のサポート

    他の AWS のサービスとの統合を使用して、 AWS アカウント 内の OpsCenter ユーザーアクションの監査およびログ記録ができます。詳細については、「」を参照してくださいOpsCenter アクティビティの監査およびログ記録を行う

  • コンソール、CLI、PowerShell、および SDK の OpsCenter 機能へのアクセス

    選択した AWS Systems Manager コンソール、AWS Command Line Interface (AWS CLI)、AWS Tools for PowerShell、AWS SDK を使用して、OpsCenter で作業できます。

OpsCenter は Amazon EventBridge とどのように連携しますか? どのサービスを使用する必要がありますか?

Amazon EventBridge は、AWS リソースの変更を記述したシステムイベントのストリームをほぼリアルタイムに配信します。すぐに設定できる簡単なルールを使用して、ルールに一致したイベントを 1 つ以上のターゲット関数またはストリームに振り分けることができます。一般的に、EventBridge では、リソースに問題があるとこれを通知します。

OpsCenter は、問題の調査と修復に役立ちます。OpsCenter は EventBridge からのデータ、またはエンジニアが手動で入力したデータをまとめるため、エンジニアは徹底的な調査を実行できます。OpsCenter では、このような問題を迅速に修復するためのオートメーションランブックも提供しています。OpsCenter は EventBridge と統合されており、OpsItems を自動的に作成 (または OpsItems を手動で作成可能) して、パフォーマンスの低下、状態の変更、実行エラー、メンテナンス通知、セキュリティアラートなどの問題に対処できます。

OpsCenter は既存のケース管理システムと統合できますか?

OpsCenter は、既存のケースマネジメントシステムを補完するように設計されています。パブリック API オペレーションを使用して、OpsItems を既存のケース管理システムに統合できます。現在のシステムで手動のライフサイクルワークフローを維持し、OpsCenter を調査と修復のハブとして使用することもできます。

OpsCenter パブリック API オペレーションの詳細については、AWS Systems Manager API リファレンスの次の API オペレーションをご覧ください。

OpsCenter の使用には料金がかかりますか?

はい。詳細については、AWS Systems Manager 料金を参照してください。

OpsCenter はオンプレミスおよびハイブリッドマネージドインスタンスと連携しますか?

はい。Systems Manager を使用するように設定されているオンプレミスのマネージドインスタンスに関する問題を調査して修正するには、OpsCenter を使用できます。Systems Manager 用のオンプレミスサーバーおよび仮想マシンのセットアップおよび設定に関する詳細については、「ハイブリッド環境で AWS Systems Manager を設定する」を参照してください。

OpsCenter のクォータとは何ですか?

すべての Systems Manager 機能のクォータは、アマゾン ウェブ サービス全般のリファレンスSystems Manager サービスのクォータで確認できます。特に明記されていない限り、クォータはリージョンごとに存在します。