一般的なベストプラクティス - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

一般的なベストプラクティス

以下のベストプラクティスは、Amazon RDS ワークロードの状態を十分に把握し、運用イベントやモニタリングデータに応じて適切なアクションを実行するのに役立ちます。

  • KPI を特定してください。望ましいビジネス成果に基づいて主要業績評価指標 (KPI) を特定します。KPI を評価してワークロードの成功を判断します。たとえば、コアビジネスが電子商取引である場合、望ましいビジネス成果の1つは、顧客が電子ショップを年中無休で利用できることです。そのビジネス上の成果を達成するには、eショップアプリケーションが使用するバックエンドの Amazon RDS データベースの可用性 KPI を定義し、ベースライン KPI を週単位で 99.99% に設定します。実際の可用性KPIをベースライン値と照らし合わせて評価すると、希望するデータベース可用性の 99.99% を満たし、24時間365日のサービスを提供することでビジネス上の成果を達成しているかどうかを判断できます。

  • ワークロードメトリクスを定義します。Amazon RDS ワークロードの量と質を測定するワークロードメトリックスを定義します。メトリクスを評価して、ワークロードが望ましい結果を達成しているかどうかを判断し、ワークロードの状態を把握します。たとえば、Amazon RDS DB インスタンスの可用性 KPI を評価するには、DB インスタンスの稼働時間やダウンタイムなどのメトリックスを測定する必要があります。次に、これらのメトリックを使用して、次のようにアベイラビリティKPIを計算できます。

    availability = uptime / (uptime + downtime)

    メトリックは、時系列のデータポイントのセットを表します。指標にはディメンションを含めることもでき、分類や分析に役立ちます。

  • ワークロードメトリクスを収集して分析します。Amazon RDS は、設定に応じてさまざまなメトリックスとログを生成します。これらの中には、DB インスタンスのイベント、カウンター、または次のような統計を表すものがあります。db.Cache.innoDB_buffer_pool_hits。その他のメトリックは、次のようなオペレーティングシステムから取得されます。memory.Totalこれは、ホストの Amazon Elastic Compute Cloud (Amazon EC2) インスタンスの合計メモリ量を測定します。監視ツールは、収集した指標を定期的かつ積極的に分析して傾向を特定し、適切な対応が必要かどうかを判断する必要があります。

  • ワークロードメトリクスのベースラインを確立します。指標のベースラインを設定して、期待値を定義し、良い閾値と悪いしきい値を特定します。たとえば、次のようなベースラインを定義できます。ReadIOPS通常のデータベース操作では最大1,000になります。その後、このベースラインを比較したり、過剰使用率を特定したりできます。読み取りIOPSが2,000〜3,000の範囲にあることが新しい指標で一貫して示されていれば、調査や介入、改善のきっかけとなる可能性のある偏差を特定したことになります。

  • ワークロードの結果が危険にさらされている場合はアラートを出します。ビジネス上の成果が危険にさらされていると判断したら、警告を発します。そうすれば、顧客に影響が及ぶ前に問題に積極的に対処することも、インシデントの影響をタイムリーに軽減することもできます。

  • ワークロードに予想されるアクティビティパターンを特定してください。メトリクスのベースラインに基づいて、ワークロードアクティビティのパターンを確立して予期しない動作を特定し、必要に応じて適切なアクションを実行してください。AWS提供する監視ツール統計アルゴリズムと機械学習アルゴリズムを適用して指標を分析し、異常を検出します。

  • ワークロードの異常が検出されたらアラートを出します。Amazon RDS ワークロードの操作に異常が検出されたら、必要に応じて適切なアクションで対応できるようにアラートを発生させます。

  • KPI と指標を見直し、改訂します。Amazon RDS データベースが定義済みの要件を満たしていることを確認し、ビジネス目標を達成するために改善の余地がある分野を特定します。測定した指標と評価した KPI の有効性を検証し、必要に応じて修正します。たとえば、データベース同時接続の最適な数の KPI を設定し、接続の試行と失敗に関するメトリクス、および作成され実行中のユーザースレッドを監視するとします。KPI ベースラインで定義されている接続数よりも多くのデータベース接続がある可能性があります。現在のメトリクスを分析することで結果を検出することはできますが、根本原因を特定できない場合があります。その場合は、メトリクスを修正し、テーブルロックのカウンターなどの監視手段を追加する必要があります。新しいメトリックは、データベース接続数の増加の原因が予期しないテーブルロックであるかどうかを判断するのに役立ちます。