OPS04-BP04 依存関係のテレメトリーを実装する - 運用上の優秀性の柱

OPS04-BP04 依存関係のテレメトリーを実装する

ワークロードが依存するリソースのステータスに関する情報が送出されるよう、ワークロードを設計および設定します。これらは、ワークロードの外にあるリソースです。外部依存関係の例としては、外部データベース、DNS、ネットワーク接続などがあります。この情報を使用して、対応が必要な場合を判断したり、ワークロードの状態に関する追加のコンテキストを提供したりします。

期待される成果:

  • ワークロードは、外部依存のステータスに関するテレメトリを送信します。

  • 依存関係に異常がある場合は通知されます。

一般的なアンチパターン:

  • ユーザーがサイトにアクセスできない。DNS の問題であるかどうかを判断するには、手動で DNS プロバイダーが動作しているかどうかを確認する必要がある。

  • ショッピングカートアプリケーションがトランザクションを完了できない。クレジットカード処理プロバイダーの問題であるかどうかを確認するには、そのプロバイダーに連絡する必要がある。

このベストプラクティスを活用するメリット:

  • 外部依存関係をモニタリングすると、問題について高度な通知が提供されます。

  • 依存関係の正常性を認識できると、トラブルシューティングに役立ちます。

このベストプラクティスが確立されていない場合のリスクレベル:

実装のガイダンス

関係者と協力して、ワークロードが依存している外部依存関係を特定します。外部依存関係には、外部データベース、API、ワークロードと他の環境にあるリソース間のネットワーク接続性などがあります。モニタリング戦略を策定して、依存関係の正常性を把握し、ステータスが変化するとプロアクティブに警告します。

お客様事例

AnyCompany Retail の E コマースワークロードは、別の環境にあるデータベースに依存しています。毎晩、データがデータベースに入力され、E コマースプラットフォームで使用されます。ネットワーク接続とデータベースのサポートは他のチームが所有しています。E コマースチームは複数の canary アラームを構成し、ネットワーク接続性が低下したり、データベースにアクセスできなかったり、ジョブが完了できなかったりした場合はアラートを発報するようにしました。

実装手順

  1. ワークロードが依存している外部依存関係を特定します。依存関係の正常性または到達可能性を追跡するテレメトリを実装します。

    1. AWS のお客様は、AWS Health Dashboard を使用して AWS のサービスの正常性をモニターし、正常性に関するイベントの通知を受け取ることができます。

    2. Amazon CloudWatch Synthetics を使用して、API、URL、ウェブサイトコンテンツをモニターできます。

  2. 依存関係に異常があったりアクセスできない場合は組織に通知するアラートをセットアップします。

    1. Enterprise Support を利用しているお客様は、テクニカルアカウントマネージャーから、モニタリング戦略の策定ワークショップをリクエストできます。このワークショップは、お客様がワークロードの可観測性戦略を策定するのを支援します。

  3. 依存関係に異常があった場合に備えて、依存関係の連絡先を特定します。依存関係の所有者への連絡方法、サービスアグリーメント、エスカレーションプロセスを文書化します。

実装計画に必要な工数レベル: 中。依存関係テレメトリの実装には、カスタムモニタリングソリューションの構築が必要になる場合があります。

リソース

関連するベストプラクティス:

関連するドキュメント:

関連動画:

関連する例:

関連サービス: