AWS Systems Manager OpsCenter - AWS Systems Manager

AWS Systems Manager OpsCenter

AWS Systems Manager の機能である OpsCenter は、オペレーションエンジニアや IT プロフェッショナルが AWS リソースに関連する運用作業項目 (OpsItems) を表示、調査、解決できる中心的な場所を提供します。OpsCenter は、AWS リソースに影響する問題の解決までの平均時間を短縮するように設計されています。Systems Manager のこの機能では、各 OpsItem、関連 OpsItems、および関連リソースに関する状況に応じた調査データを提供しながら、サービス間で OpsItems を集約および標準化します。また、OpsCenter では、問題を迅速な解決に使用できる Systems Manager Automation ドキュメント (ランブック) も提供しています。検索可能なカスタムデータを OpsItem ごとに指定することができます。OpsItems に関する自動的に生成された概要レポートは、ステータスおよびソース別に表示することもできます。

OpsCenter は Amazon EventBridge および Amazon CloudWatch と統合されています。つまり、CloudWatch アラームが ALARM 状態になったとき、またはイベントを発行する AWS サービスからのイベントを EventBridge が処理するときに、OpsCenter で OpsItem を自動的に作成するこれらのサービスを設定できます。CloudWatch アラームと EventBridge イベントが自動的に OpsItems を作成するように構成すると、1 つのコンソールから AWS リソースに関する問題を迅速に診断および修正できます。

問題の診断に役立つように、各 OpsItem には、OpsItem を生成した AWS リソースの名前と ID、アラームまたはイベントの詳細、アラーム履歴、アラームタイムライングラフなど、状況に応じた関連情報が含まれています。

AWS リソースに対し、OpsCenter は AWS Config、AWS CloudTrail ログおよび Amazon CloudWatch Events の情報を集約するため、調査中に複数のコンソールページ間を移動する必要がありません。

次のリストは、OpsItems を作成する CloudWatch アラームを設定するお客様の AWS リソースとメトリックスのタイプを示しています。

  • Amazon DynamoDB: データベースの読み取りおよび書き込みアクションがしきい値に達する

  • Amazon EC2: CPU 使用率がしきい値に達する

  • AWS 請求: 推定請求額がしきい値に達する

  • Amazon EC2: インスタンスはステータスチェックに失敗する

  • Amazon Elastic Block Store (EBS): ディスク領域の使用率がしきい値に達する

次のリストでは、お客様が OpsItems を作成するために構成する CloudWatch イベント ルールの種類を示しています。

  • AWS Security Hub: セキュリティアラートが発行されました

  • DynamoDB: スロットリングイベント

  • Amazon EC2 Auto Scaling: インスタンスを起動できませんでした

  • Systems Manager: オートメーションを実行できませんでした

  • AWS Health: スケジュールされたメンテナンスのアラート

  • EC2: インスタンスの状態が Running から Stopped に変わる

OpsCenter はまた、Amazon CloudWatch Application Insights for .NET and SQL Server と統合されます。つまり、アプリケーションで検出された問題に対して自動的に OpsItems を作成できます。

オペレーションエンジニアおよび IT プロフェッショナルは、AWS Systems Manager コンソールの OpsCenter ページ、パブリック API アクション、AWS Command Line Interface (AWS CLI)、AWS Tools for Windows PowerShell、または AWS SDK を使用して、OpsItems を作成、表示、および編集できます。OpsCenter パブリック API アクションを使用することで、OpsCenter をケース管理システムおよび正常性ダッシュボードと統合することもできます。

OpsCenter はどのように組織にとってメリットになりますか?

AWS Systems Manager OpsCenter では、AWS リソースに関する問題を表示、対応、修正するための統一された標準エクスペリエンスを実現します。統一された標準エクスペリエンスによって、問題の解決やその問題の調査、新しいオペレーションエンジニアと IT プロフェッショナルのトレーニングにかかる時間は短縮されます。また、統一された標準エクスペリエンスでは、問題を管理して修正するシステムに対する手動エラーの数が低下します。

具体的には、OpsCenter は、オペレーションエンジニアや組織にとって、次のような利点があります。

  • AWS リソースに関連する OpsItems を表示、調査、解決するために複数のコンソールページを移動する必要はありません。OpsItems は、サービス全体の中心の場所に集約されます。

  • CloudWatch アラームおよび Amazon EventBridge イベント、CloudWatch Application Insights for .NET および SQL Server によって自動的に生成された OpsItems のサービス固有のデータや状況に応じた関連のデータを表示できます。

  • OpsItem に関するリソースの Amazon リソースネーム (ARN) を指定することができます。関連リソースを指定することで、OpsCenter は、組み込みロジックを使用して、OpsItems が重複しないようにします。

  • 同様の OpsItems の詳細や解決方法に関する情報を確認することができます。

  • 問題を解決するには、Systems Manager オートメーションドキュメント (ランブック) に関する情報をすばやく表示して実行します。

OpsCenter の特徴は何ですか?

  • 自動スナップショットと手動 OpsItem 作成

    OpsCenter は Amazon CloudWatch と統合されています。つまり、アラームが ALARM 状態になったとき、またはイベントを発行する AWS サービスからのイベントを Amazon EventBridge が処理するときに、OpsCenter で OpsItem を自動的に作成するように CloudWatch を設定できます。手動で OpsItems を作成することもできます。

    OpsCenter はまた、Amazon CloudWatch Application Insights for .NET and SQL Server と統合されます。つまり、アプリケーションで検出された問題に対して自動的に OpsItems を作成できます。

  • 詳細で検索可能な OpsItems

    各 OpsItem には、情報の複数のフィールドを含みます。たとえば、OpsItem のタイトル、ID、優先度、説明のほか、最終更新日時などがあります。各 OpsItem には、次の設定可能な機能も含まれます。

    • ステータス: Open、In progress、Resolved、または Open and In progress。

    • 関連リソース: 関連リソースは、影響を受けるリソース、または OpsItem を作成した Amazon EventBridge イベントをトリガーしたリソースです。各 OpsItem には、[関連リソース] セクションを含みます。OpsCenter によって、関連リソースの Amazon リソースネーム (ARN) が自動的に表示されます。また、関連リソースの ARN を手動で指定することもできます。一部の ARN タイプでは、その情報を表示するために他のコンソールページにアクセスしなくても、OpsCenter によって、リソースに関する詳細を表示するディープリンクが自動的に作成されます。たとえば、EC2 インスタンスの ARN を指定すると、OpsCenter のそのインスタンスに関する EC2 提供の詳細をすべて表示できます。その他の関連リソースの ARN は手動で追加することができます。各 OpsItem セクションには、最大 100 個の関連リソースの ARN が表示されます。詳細については、「関連リソースの使用」を参照してください。

    • 関連および同様の OpsItems: [関連 OpsItems (Related)] 機能を使用すると、現在の OpsItem に関連する OpsItems の ID を指定できます。[同様の OpsItem] 機能によって、OpsItem のタイトルや説明が自動的に確認されてから、関連する、またはその他のユーザー向けの他の OpsItems が一覧表示されます。

    • 検索可能でプライベートな運用データ: 運用データは、OpsItem に関する有用なリファレンスの詳細を提供するカスタムデータです。たとえば、ログファイル、エラー文字列、ライセンスキー、トラブルシューティングのヒント、その他の関連データを指定することができます。キーと値のペアで、運用データを入力します。キーの最大長は 128 文字です。値の最大サイズは 20 KB です。

      このカスタムデータは検索可能ですが、制限があります。[Searchable operational data] (検索可能な運用データ) 機能で、(DescribeOpsItems の API アクションによって提供される) OpsItem の概要ページにアクセスできるユーザーは誰でも、指定されたデータを表示および検索することができます。[Private operational data] (プライベートな運用データ) 機能で、データは、(GetOpsItem API アクションと同様) OpsItem にアクセスできるユーザーのみが表示できます。

    • 重複排除: 関連リソースを指定することで、OpsCenter は、組み込みロジックを使用して、OpsItems が重複しないようにします。さらに、EventBridge でイベントから自動的に作成された OpsItems には、重複 OpsItems の数を減らすための重複排除文字列が含まれています。詳細については、「OpsItems の重複排除」を参照してください。

  • ランブックを使用した簡単な修復

    各 OpsItem には、AWS リソースに関する一般的な問題を自動的に修正するために使用できる Systems Manager オートメーションドキュメントのリストを含む [Runbooks] (ランブック) セクションが含まれています。OpsItem を開き、その OpsItem の AWS リソースを選択し、コンソールで [Run Automation] (自動化を実行) ボタンを選択すると、OpsCenter に OpsItem を生成した AWS リソースで実行できる自動化ドキュメントのリストが表示されます。OpsItem から Automation ドキュメント (ランブック) を実行したら、ランブックは、将来の参照を目的として、OpsItem の関連リソースに自動的に関連付けられます。さらに、OpsCenter を使用して Amazon EventBridge に OpsItem ルールを自動的に設定した場合は、一般的なイベントのランブックは、EventBridge によって、自動的に関連付けられます。OpsCenter は、特定の OpsItem に対して実行された Automation ドキュメントの 30 日間のレコードを保持します。詳細については、Systems Manager オートメーションを使用した OpsItem の問題の修正 をご参照ください。

  • 通知の変更: OpsItem が変更または編集される場合はいつでも、Amazon Simple Notification Service (SNS) トピックの ARN を指定して通知を発行できます。SNS トピックは、OpsItem と同じ AWS リージョンに存在する必要があります。

  • 包括的な OpsItem の検索機能: OpsCenter では、OpsItems を速やかに見つけやすいように、複数の検索オプションが提供されています。検索方法の例は次のとおりです: ランブック実行の OpsItem ID、タイトル、最終更新日時、運用データ値、ソース、および自動化 ID。検索結果を絞り込むには、ステータスフィルターを使用します。

  • OpsItem 概要レポート

    OpsCenter には、概要レポートページが含まれており、次のセクションが自動的に表示されます。

    • ステータスの概要: OpsItems の概要 (ステータス別: Open、In progress、Resolved、Open and In progress)。

    • Sources with most open OpsItems: オープンな OpsItems を持つ上位の AWS のサービスの内訳。

    • OpsItems by source and age: ソースから作成された日数までにグループ化された OpsItems の数。

    OpsCenter 概要レポートの表示の詳細については、「OpsCenter 概要レポートの表示」を参照してください。

  • IAM アクセスコントロール

    AWS Identity and Access Management (IAM) ポリシーを使用することで、OpsItems を作成、表示、一覧表示、更新できる組織のメンバーを制御できます。また、タグを OpsItems に割り当ててから、タグに基づきユーザーおよびグループにアクセス権を付与する IAM ポリシーを作成します。詳細については、「OpsCenter の開始方法」を参照してください。

  • ログ記録および監査機能のサポート

    他の AWS サービスとの統合を使用して、AWS アカウント内の OpsCenter ユーザーアクションの監査およびログ記録ができます。詳細については、「OpsCenter アクティビティの監査とログ記録」を参照してください。

  • コンソール、CLI、PowerShell、および SDK の OpsCenter 機能へのアクセス

    選択した AWS Systems Manager コンソール、AWS CLI、AWS Tools for PowerShell、AWS SDK を使用して、OpsCenter で作業できます。

Amazon EventBridge と OpsCenter の連携方法 どのサービスを使用する必要がありますか?

Amazon EventBridge は、AWS リソースの変更を示すシステムイベントのほぼリアルタイムのストリームを提供します。すぐに設定できる簡単なルールを使用して、ルールに一致したイベントを 1 つ以上のターゲット関数またはストリームに振り分けることができます。一般的に言って、EventBridge では、リソースに問題があることを把握することができます。

OpsCenter は問題の調査と修正に役立ちます。OpsCenter は、エンジニアが徹底的な調査を実行できるように、EventBridge のデータ、またはエンジニアが手動で入力したデータをまとめます。また、OpsCenter では、問題 (例: パフォーマンスの低下、状態の変化、実行の失敗、メンテナンス通知、セキュリティ警告) を迅速に解決するための Automation ランブックも提供しています。OpsCenter は、以下のタイプの問題に対処するために OpsItems を自動的に作成する (または手動で OpsItems を作成する) ことができるように EventBridge と統合します。

OpsCenter は既存のケース管理システムと統合できますか?

OpsCenter は既存のケース管理システムを補完するように設計されています。パブリック API アクションを使用して、OpsItems を既存のケース管理システムに統合できます。現在のシステムで手動のライフサイクルワークフローを維持し、OpsCenter を調査および修復のハブとして使用することもできます。

OpsCenter パブリック API アクションについては、AWS Systems Manager API リファレンス で以下の API アクションを参照してください。

OpsCenter の使用料金はかかりますか?

はい。詳細については、「AWS Systems Manager 料金表」を参照してください。

OpsCenter はオンプレミスおよびハイブリッドマネージドインスタンスと連携しますか?

はい。Systems Manager を使用するように構成されているオンプレミスのマネージドインスタンスに関する問題を調査して修正するには、OpsCenter を使用できます。Systems Manager 用のオンプレミスサーバーおよび仮想マシンのセットアップおよび構成に関する詳細は、ハイブリッド環境で AWS Systems Manager を設定する を参照してください。

OpsCenter のリソース制限について説明します。

リソース デフォルトの制限

AWS リージョンあたりのアカウントごとに許可されている OpsItems の合計数 (オープンおよび解決済みの OpsItems を含む)

500,000

1 か月のアカウントあたりの OpsItems の最大数

10,000

運用データ値の最大サイズ

20 KB

OpsItem あたりの関連付けられているオートメーションランブックの最大数

10

関連付けられた単一のランブックの運用データに格納されているオートメーションランブック実行の最大数

10

OpsItem ごとに指定できる関連リソースの最大数

100

OpsItem ごとに指定できる関連 OpsItems の最大数

10

重複排除文字列の最大長

64 文字

ステータスに関係なく OpsItem がシステムによって自動的にアーカイブされるまでの期間

36 か月間