AWS Systems Manager OpsCenter - AWS Systems Manager

AWS Systems Manager OpsCenter

AWS Systems Manager の一機能である OpsCenter は、オペレーションエンジニアや IT プロフェッショナルが AWS リソースに関連する運用作業項目 (OpsItems) を表示、調査、解決できる中心的な場所を提供します。OpsCenter は、AWS リソースに影響する問題の解決までの平均時間を短縮するように設計されています。Systems Manager 機能では、各 OpsItem、関連のある OpsItems、および関連リソースに関する状況に応じた調査データを提供しながら、サービス間で OpsItems を集約および標準化します。また、OpsCenter では、問題を迅速な解決に使用できる Systems Manager Automation ドキュメント (ランブック) も提供しています。検索可能なカスタムデータを OpsItem ごとに指定することができます。OpsItems に関する自動的に生成された概要レポートは、ステータスおよびソース別に表示することもできます。OpsCenter の使用を開始するには、Systems Manager コンソールを開きます。ナビゲーションペインで、[OpsCenter] を選択します。

OpsCenter は Amazon EventBridge および Amazon CloudWatch と統合されています。つまり、CloudWatch アラームが ALARM の状態になったとき、または EventBridge がイベントを発行する AWS のサービスからのイベントを処理するときに、OpsCenter で OpsItem を自動的に作成するようにこれらのサービスを設定できます。CloudWatch アラームと EventBridge イベントが自動的に OpsItems を作成するように構成すると、1 つのコンソールから AWS リソースに関する問題を迅速に診断および修正できます。

問題の診断に役立つように、各 OpsItem には、OpsItem を生成した AWS リソースの名前と ID、アラームまたはイベントの詳細、アラーム履歴、アラームタイムライングラフなど、状況に応じた関連情報が含まれています。

AWS リソースに対し、OpsCenter は AWS Config、AWS CloudTrail ログおよび Amazon CloudWatch Events の情報を集約するため、調査中に複数のコンソールページ間を移動する必要がありません。

次のリストは、OpsItems を作成する CloudWatch アラームを設定するお客様の AWS リソースとメトリックスのタイプを示しています。

  • Amazon DynamoDB: データベースの読み取りおよび書き込みアクションがしきい値に達する

  • Amazon EC2: CPU 使用率がしきい値に達する

  • AWS 請求: 推定請求額がしきい値に達する

  • Amazon EC2: インスタンスがステータスチェックに失敗する

  • Amazon Elastic Block Store (EBS): ディスク領域の使用率がしきい値に達する

次のリストには、OpsItems を作成するためにお客様が設定する EventBridge ルールの種類を示します。

  • AWS Security Hub: セキュリティアラートが発行されました

  • DynamoDB: スロットリングイベント

  • Amazon EC2 Auto Scaling: インスタンスの起動に失敗しました

  • Systems Manager: オートメーションを実行できませんでした

  • AWS Health: スケジュールされたメンテナンスのアラート

  • EC2: インスタンスの状態が Running から Stopped に変わる

OpsCenter は、.NET および SQL Server 用の Amazon CloudWatch Application Insights とも統合されています。つまり、アプリケーションで検出された問題に対して自動的に OpsItems を作成できます。また、OpsCenter を AWS Security Hub と統合して、Systems Manager のセキュリティ、パフォーマンス、運用上の問題を集約し、アクションを実行することもできます。

オペレーションエンジニアおよび IT プロフェッショナルは、AWS Systems Manager コンソールの OpsCenter ページ、パブリック API オペレーション、AWS Command Line Interface (AWS CLI)、AWS Tools for Windows PowerShell、または AWS SDK を使用して、OpsItems を作成、表示、および編集できます。OpsCenter パブリック API アクションを使用すると、OpsCenter をケース管理システムおよび正常性ダッシュボードと統合することも可能です。

OpsCenter の統合

次の表に、OpsCenter が他の AWS のサービスおよび Systems Manager 機能と統合する方法について説明します。OpsCenter は、これらのサービスおよび機能と統合されている場合、1 つのコンソールから AWS リソースに関する問題を迅速に診断および修復するのに役立ちます。

サービスや機能 詳細 詳細については

EventBridge

システムがイベントを発行する AWS のサービスからのイベントを処理するときに、OpsCenter で OpsItem を自動的に作成するように Amazon EventBridge を設定できます。次のリストには、OpsItems を作成するために設定できる EventBridge ルールの種類を示します。

  • AWS Security Hub: セキュリティアラートが発行されました

  • Amazon DynamoDB: スロットリングイベント

  • Amazon EC2 Auto Scaling: インスタンスの起動に失敗しました

  • Systems Manager: オートメーションを実行できませんでした

  • AWS Health: スケジュールされたメンテナンスのアラート

  • Amazon Elastic Compute Cloud (Amazon EC2): インスタンスの状態の Running から Stopped への変更

問題を診断に役立つように、各 OpsItem には、OpsItem を生成した AWS リソースの名前と ID、イベントの詳細など、イベントに関する文脈に応じた関連情報が含まれています。

特定のイベントで OpsItems が自動的に作成されるように EventBridge を設定する

CloudWatch

CloudWatch アラームが ALARM 状態になったときに、OpsCenter で OpsItem が自動的に作成されるように Amazon CloudWatch を設定できます。次のリストは、OpsItems を作成する CloudWatch アラームを設定することができる AWS リソースとメトリクスのタイプを示しています。

  • DynamoDB: データベースの読み取りおよび書き込みアクションがしきい値に達する

  • Amazon EC2: CPU 使用率がしきい値に達する

  • AWS Billing and Cost Management: 推定請求額がしきい値に達する

  • Amazon EC2: インスタンスがステータスチェックに失敗する

  • Amazon Elastic Block Store (Amazon EBS): ディスク領域の使用率がしきい値に達する

問題の診断に役立つように、各 OpsItem には、OpsItem を生成した AWS リソースの名前と ID、アラームの詳細、アラーム履歴、アラームタイムライングラフなど、アラームに関する状況に応じた関連情報が含まれています。

アラームから OpsItems を作成するように CloudWatch を設定する

Incident Manager

Systems Manager の一機能である AWS Incident Manager は、AWS でホストされたアプリケーションに影響を与えるインシデントを軽減し、回復するのに役立つインシデント管理コンソールを提供します。インシデントとは、サービスの品質の計画外の中断または低下です。Incident Manager をセットアップして設定すると、Incident Manager でインシデントが作成する際に、システムは OpsCenter で自動的に OpsItems を作成します。OpsItem にインシデントを手動で追加することもできます。

インシデントが解決されたら、インシデント後の分析により、インシデントへの対応を改善するための改善点を特定し、検出結果に対処するためのアクションアイテムを推奨する手順が示されます。インシデントなどの重大度の高いオペレーション上の問題では、OpsCenter で OpsItem を作成すると、オペレーターはインシデント、分析、およびアクション項目の詳細を確認できます。この包括的なビューにより、解決までの時間が短縮され、将来発生する同様の問題を軽減できます。

OpsCenter での Incident Manager インシデントの操作

AWS Systems Manager Incident Manager ユーザーガイド

CloudWatch Application Insights for .NET and SQL Server

OpsCenter は、.NET および SQL Server 用の CloudWatch Application Insights とも統合されています。CloudWatch Application Insights は、他のアプリケーションリソースとともに Amazon EC2 インスタンスを使用するアプリケーションをモニタリングするのに役立ちます。この機能は、アプリケーションリソースとテクノロジースタック全体の主要なメトリクス、ログ、アラームを識別して設定します。この機能では、検出された問題の自動ダッシュボードも作成されます。ダッシュボードには、エラーの根本原因を特定するのに役立つ相関メトリクスの異常、ログエラー、およびその他の情報が含まれています。CloudWatch Application Insights でアプリケーションリソースを設定する場合、問題が検出されたときにシステムが OpsCenter で OpsItems を作成するように選択できます。

Amazon CloudWatch ユーザーガイドでのアプリケーションのセットアップ

OpsItem を自動的に生成する各 AWS リソースについて、OpsCenter は、AWS Config、AWS CloudTrail ログ、および EventBridge からの情報を集約します。そのため、調査中に複数のコンソールページを移動する必要はありません。

OpsCenter はどのように組織にとってメリットになりますか?

OpsCenter では、AWS リソースに関する問題を表示、対応、修正するための統一された標準エクスペリエンスを提供します。統一された標準エクスペリエンスによって、問題の解決やその問題の調査、新しいオペレーションエンジニアと IT プロフェッショナルのトレーニングにかかる時間は短縮されます。また、統一された標準エクスペリエンスでは、問題を管理して修正するシステムに対する手動エラーの数が低下します。

具体的には、OpsCenter は、オペレーションエンジニアや組織にとって、次のような利点があります。

  • AWS リソースに関連する OpsItems を表示、調査、解決するために複数のコンソールページを移動する必要はありません。OpsItems は、サービス全体の中心の場所に集約されます。

  • CloudWatch アラーム、EventBridge イベント、および .NET および SQL Server 用の CloudWatch Application Insights によって自動的に生成される OpsItems のサービス固有のデータおよびコンテキストに関連するデータを表示できます。

  • OpsItem に関するリソースの Amazon リソースネーム (ARN) を指定することができます。関連リソースを指定することで、OpsCenter は、組み込みロジックを使用して、OpsItems が重複しないようにします。

  • 同様の OpsItems の詳細や解決方法に関する情報を確認することができます。

  • 問題を解決するには、Systems Manager Automation ランブック に関する情報をすばやく表示して実行します。

OpsCenter の特徴は何ですか?

  • 自動スナップショットと手動 OpsItem 作成

    OpsCenter は Amazon CloudWatch と統合されています。つまり、アラームが ALARM 状態になったとき、または Amazon EventBridge がイベントを発行する AWS のサービスからのイベントを処理するときに、OpsCenter で OpsItem を自動的に作成するように CloudWatch を設定できます。手動で OpsItems を作成することもできます。

    OpsCenter は、.NET および SQL Server 用の Amazon CloudWatch Application Insights とも統合されています。つまり、アプリケーションで検出された問題に対して自動的に OpsItems を作成できます。

  • 詳細で検索可能な OpsItems

    各 OpsItem には、情報の複数のフィールドを含みます。たとえば、OpsItem のタイトル、ID、優先度、説明のほか、最終更新日時などがあります。各 OpsItem には、次の設定可能な機能も含まれます。

    • ステータス: Open、In progress、Resolved、または Open and In progress。

    • 関連リソース: 関連リソースは、影響を受けるリソース、または OpsItem を作成した EventBridge イベントを開始したリソースです。各 OpsItem には、[関連リソース] セクションを含みます。OpsCenter によって、関連リソースの Amazon リソースネーム (ARN) が自動的に表示されます。また、関連リソースの ARN を手動で指定することもできます。一部の ARN タイプでは、その情報を表示するために他のコンソールページにアクセスしなくても、OpsCenter によって、リソースに関する詳細を表示するディープリンクが自動的に作成されます。たとえば、EC2 インスタンスの ARN を指定すると、OpsCenter のそのインスタンスに関する EC2 提供の詳細をすべて表示できます。その他の関連リソースの ARN は手動で追加することができます。各 OpsItem セクションには、最大 100 個の関連リソースの ARN が表示されます。詳細については、「関連リソースの使用」を参照してください。

    • 関連および同様の OpsItems: [関連 OpsItems (Related)] 機能を使用すると、現在の OpsItem に関連する OpsItems の ID を指定できます。[同様の OpsItem] 機能によって、OpsItem のタイトルや説明が自動的に確認されてから、関連する、またはその他のユーザー向けの他の OpsItems が一覧表示されます。

    • 検索可能でプライベートな運用データ: 運用データは、OpsItem に関する有用なリファレンスの詳細を提供するカスタムデータです。たとえば、ログファイル、エラー文字列、ライセンスキー、トラブルシューティングのヒント、その他の関連データを指定することができます。キーと値のペアで、運用データを入力します。キーの最大長は 128 文字です。値の最大サイズは 20 KB です。

      このカスタムデータは検索可能ですが、制限があります。[Searchable operational data (検索可能な運用データ)] 機能で (DescribeOpsItems API オペレーションによって提供)、OpsItem 概要ページにアクセスできるユーザーは誰でも、指定されたデータを表示および検索することができます。[Private operational data (プライベートな運用データ)] 機能で、(GetOpsItem API オペレーションと同様) OpsItem にアクセスできるユーザーのみがデータに表示できます。

    • 重複排除機能: 関連リソースを指定することにより、OpsCenterは、組み込みロジックを使用して、OpsItems が重複しないようにします。OpsCenter にはオペレーションインサイトという機能も含まれており、重複した OpsItems に関する情報が表示されます。アカウントで重複する OpsItems の数をさらに制限するには、EventBridge イベントルールに重複排除文字列を手動で指定できます。詳細については、「OpsItems の重複排除」を参照してください。

  • 一括編集OpsItems: OpsCenter で複数の OpsItems を選択し、次のフィールドのいずれかを編集します。ステータス優先度重要度カテゴリ

  • ランブックを使用した簡単な修復

    各 OpsItem には、AWS リソースに関する一般的な問題を自動的に修正するために使用できる Systems Manager Automation ランブックのリストを含む [Runbooks (ランブック)] セクションがあります。OpsItem を開き、その OpsItem の AWS リソースを選択し、コンソールで [Run automation (自動化を実行)] ボタンを選択すると、OpsCenter に OpsItem を生成した AWS リソースで実行できる自動化ドキュメントのリストが表示されます。OpsItem から Automation ランブックを実行したら、ランブックは、将来の参照を目的として、OpsItem の関連リソースに自動的に関連付けられます。さらに、OpsCenter を使用して EventBridge で OpsItem ルールを自動的に設定した場合は、一般的なイベントのランブックは、EventBridge によって自動的に関連付けられます。OpsCenter は、特定の OpsItem に対して実行された Automation ランブックのレコードを 30 日間保持します。詳細については、「Systems Manager Automation を使用して OpsItem の問題を修復」を参照してください。

  • 変更通知: OpsItem が変更または編集されたときはいつでも、Amazon Simple Notification Service (SNS) トピックの ARN を指定して通知を発行できます。SNSトピックは、OpsItem と同じ AWS リージョン に存在する必要があります。

  • 包括的な OpsItem の検索機能: OpsCenter では、OpsItems を速やかに見つけやすいように、複数の検索オプションが提供されています。検索方法の例は次のとおりです: ランブック実行の OpsItem ID、タイトル、最終更新日時、運用データ値、ソース、および自動化 ID。検索結果を絞り込むには、ステータスフィルターを使用します。

  • OpsItem 概要レポート

    OpsCenter には、概要レポートページが含まれており、次のセクションが自動的に表示されます。

    • ステータスの概要: OpsItems の概要 (ステータス別: Open、In progress、Resolved、Open and In progress)。

    • Sources with most open OpsItems: オープン OpsItems が含まれている上位の AWS のサービスの内訳。

    • OpsItems by source and age: ソースから作成された日数までにグループ化された OpsItems の数。

    OpsCenter 概要レポートの表示の詳細については、「OpsCenter 概要レポートの表示」を参照してください。

  • IAM アクセスコントロール

    AWS Identity and Access Management (IAM) ポリシーを使用することで、OpsItems を作成、表示、一覧表示、更新できる組織のメンバーを制御できます。また、タグを OpsItems に割り当ててから、タグに基づきユーザーおよびグループにアクセス権を付与する IAM ポリシーを作成します。詳細については、「OpsCenterで開始」を参照してください。

  • ログ記録および監査機能のサポート

    他の AWS のサービスとの統合を使用して、AWS アカウント の OpsCenter ユーザーアクションの監査およびログ記録を行うことができます。詳細については、「OpsCenter アクティビティの監査とログ記録」を参照してください。

  • コンソール、CLI、PowerShell、および SDK の OpsCenter 機能へのアクセス

    AWS Systems Manager コンソール、AWS Command Line Interface (AWS CLI)、AWS Tools for PowerShell、または AWS SDK を使用すると OpsCenter を操作できます。

OpsCenter は Amazon EventBridge とどのように連携しますか? どのサービスを使用する必要がありますか?

Amazon EventBridge は、AWS リソースの変更を記述したシステムイベントのストリームをほぼリアルタイムに配信します。すぐに設定できる簡単なルールを使用して、ルールに一致したイベントを 1 つ以上のターゲット関数またはストリームに振り分けることができます。一般的に、EventBridge では、リソースに問題があるとこれを通知します。

OpsCenter は問題の調査と修正に役立ちます。OpsCenter は、エンジニアが徹底的な調査を実行できるように、EventBridge のデータ、またはエンジニアが手動で入力したデータをまとめます。また、OpsCenter では、問題 (例: パフォーマンスの低下、状態の変化、実行の失敗、メンテナンス通知、セキュリティ警告) を迅速に解決するための Automation ランブックも提供しています。OpsCenter は、以下のタイプの問題に対処するために OpsItems を自動的に作成する (または手動で OpsItems を作成する) ことができるよう EventBridge と統合します。

OpsCenter は既存のケース管理システムと統合できますか?

OpsCenter は既存のケース管理システムを補完するように設計されています。パブリック API オペレーションを使用して、OpsItems を既存のケース管理システムに統合できます。現在のシステムで手動のライフサイクルワークフローを維持し、OpsCenter を調査および修復のハブとして使用することもできます。

OpsCenter パブリック API オペレーションの詳細については、AWS Systems Manager API リファレンスの次の API オペレーションをご覧ください。

OpsCenter の使用料金はかかりますか?

はい。詳細については、AWS Systems Manager 料金を参照してください。

OpsCenter はオンプレミスおよびハイブリッドマネージドノードと連携しますか?

はい。Systems Manager を使用するように設定されているオンプレミスのマネージドノードに関する問題を調査して修正するには、OpsCenter を使用できます。Systems Manager 用のオンプレミスサーバーおよび仮想マシンのセットアップおよび設定に関する詳細については、「ハイブリッド環境で AWS Systems Manager を設定する」を参照してください。

OpsCenter のクォータとは?

すべての Systems Manager 機能のクォータは、アマゾン ウェブ サービス全般のリファレンスSystems Manager サービスのクォータで確認できます。特に明記されていない限り、クォータはリージョンごとに存在します。