一般的なベストプラクティス

PDF

RSS

フォーカスモード

一般的なベストプラクティス - AWS 規範ガイダンス

以下のベストプラクティスは、Amazon RDS ワークロードの状態を十分に把握し、運用イベントやモニタリングデータに応じて適切なアクションを実行するのに役立ちます。

KPIs を特定します。期待されるビジネス成果に基づいて、主要業績評価指標 (KPIsを特定します。KPI KPIs。例えば、コアビジネスが e コマースの場合、希望するビジネス成果の 1 つは、顧客が e ショップを 24 時間 365 日利用できることです。このビジネス成果を達成するには、e ショッピングアプリケーションが使用するバックエンド Amazon RDS データベースの可用性 KPI を定義し、ベースライン KPI を毎週 99.99% に設定します。ベースライン値に対する実際の可用性 KPI を評価することで、希望するデータベースの可用性を 99.99% 満たしているかどうかを判断し、24 時間 365 日サービスを提供することでビジネス成果を達成できます。
ワークロードメトリクスを定義します。ワークロードメトリクスを定義して、Amazon RDS ワークロードの量と品質を測定します。メトリクスを評価して、ワークロードが望ましい成果を達成しているかどうかを判断し、ワークロードの状態を把握します。例えば、Amazon RDS DB インスタンスの可用性 KPI を評価するには、DB インスタンスの稼働時間とダウンタイムなどのメトリクスを測定する必要があります。その後、これらのメトリクスを使用して、可用性 KPI を次のように計算できます。
```
availability = uptime / (uptime + downtime)
```
メトリクスは、時系列のデータポイントのセットを表します。メトリクスには、分類と分析に役立つディメンションを含めることもできます。
ワークロードメトリクスを収集して分析します。Amazon RDS は、設定に応じてさまざまなメトリクスとログを生成します。これらの一部は、DB インスタンスイベント、カウンター、またはなどの統計を表しますdb.Cache.innoDB_buffer_pool_hits。その他のメトリクスは、ホスト Amazon Elastic Compute Cloud (Amazon EC2) インスタンスの合計メモリ量memory.Totalを測定するなどのオペレーティングシステムから取得されます。モニタリングツールは、収集されたメトリクスを定期的にプロアクティブに分析して傾向を特定し、適切な対応が必要かどうかを判断する必要があります。
ワークロードメトリクスのベースラインを確立します。メトリクスのベースラインを確立して、想定値を定義し、良いしきい値と悪いしきい値を特定します。例えば、通常のデータベースオペレーションでは、のベースラインReadIOPSを最大 1,000 に定義できます。その後、このベースラインを使用して比較し、過剰使用率を特定できます。新しいメトリクスで読み取り IOPS が 2,000～3,000 の範囲にあることが一貫して示されている場合は、調査、介入、改善のための対応をトリガーする可能性のある逸脱を特定しました。
ワークロードの成果がリスクにさらされているときにアラートします。ビジネス成果がリスクにさらされていると判断した場合は、アラートを発行します。その後、顧客に影響を与える前に問題を事前に対処するか、インシデントの影響をタイムリーに軽減できます。
ワークロードのアクティビティの予想されるパターンを特定します。メトリクスのベースラインに基づいて、ワークロードアクティビティのパターンを確立して予期しない動作を特定し、必要に応じて適切なアクションで対応します。 AWS には、統計アルゴリズムと機械学習アルゴリズムを適用してメトリクスを分析し、異常を検出するモニタリングツールが用意されています。
ワークロードの異常が検出されたときに警告します。Amazon RDS ワークロードのオペレーションで異常が検出されたときは、必要に応じて適切なアクションで対応できるように警告を発します。
KPIs。Amazon RDS データベースが定義された要件を満たしていることを確認し、ビジネス目標を達成するための潜在的な改善点を特定します。測定されたメトリクスと評価された KPIs の有効性を検証し、必要に応じて修正します。例えば、同時データベース接続の最適な数に KPI を設定し、試行された接続と失敗した接続、および作成されて実行中のユーザースレッドに関するメトリクスをモニタリングするとします。KPI ベースラインで定義されている接続よりも多くのデータベース接続がある場合があります。現在のメトリクスを分析することで、結果を検出できますが、根本原因を特定できない場合があります。その場合は、メトリクスを修正し、テーブルロックのカウンターなどの追加のモニタリング対策を含める必要があります。新しいメトリクスは、データベース接続の数の増加が予期しないテーブルロックによって引き起こされているかどうかを判断するのに役立ちます。