DevOps Guru のベストプラクティス - Amazon DevOps Guru

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

DevOps Guru のベストプラクティス

以下のベストプラクティスは、Amazon DevOps Guru によって検出された異常な動作を理解、診断、および修正するために役立ちます。ベストプラクティスと「DevOps Guru コンソールに表示されるインサイト」を使用して、DevOps Guru によって検出されたオペレーションの問題に対処できます。

  • 最初に、インサイトのタイムラインビューでハイライトされたメトリクスを確認します。これらのメトリクスは、問題の重要な指標であることがあります。

  • Amazon CloudWatch を使用して、インサイト内でハイライトされた最初のメトリクスの直前に発生したメトリクスを表示し、動作がいつどのように変更されたかを特定します。これは、問題を診断して解決するために役立ちます。

  • Amazon RDS リソースについては、Performance Insights のメトリクスを参照してください。カウンターメトリクスをデータベースの負荷に関連付けることで、パフォーマンスの問題に関する詳細情報を取得できます。詳細については、「Analyzing performance anomalies with DevOps Gurufor Amazon RDS」を参照してください。

  • 同じメトリクスの複数のディメンションは、異常になることがあります。問題を深く理解するには、グラフビューのディメンションを確認してください。

  • インサイトのイベントセクションで、インサイトが作成された頃に発生したデプロイイベントまたはインフラストラクチャイベントを確認します。インサイトの異常な動作が発生したときに発生したイベントを知ることは、問題の理解と診断に役立ちます。

  • 手掛かりのためのインサイトとして、オペレーションシステム内でほぼ同じ時期に発生したチケットを探します。

  • インサイトでレコメンデーションを読み、レコメンデーションのリンクにアクセスします。多くの場合、問題の診断と解決に役立つトラブルシューティングのステップが提供されています。

  • すでに問題を解決している場合を除き、解決済みのインサイトを無視しないでください。解決されている場合でも、1 日 1 回は新しいインサイトを確認してください。できるだけ多くのインサイトの背後にある根本原因を理解するようにしてください。システムの問題の兆候である可能性のあるパターンを探してください。システムの問題が未解決のままにしておくと、将来的により深刻な問題が発生する可能性があります。問題をその場で修正しておくと、将来における深刻なインシデントを防止するのに役立ちます。