信頼性の柱 - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

信頼性の柱

信頼性の柱には、ワークロードが意図した機能を正しく一貫して実行する能力が含まれます。これには、ライフサイクル全体を通じてワークロードを運用およびテストする機能が含まれます。

信頼性の高いワークロードの設定は、ソフトウェアとインフラストラクチャの両方について、事前の設計上の決定から始まります。アーキテクチャの選択は、Well-Architected の柱のすべてにおいて、ワークロードの動作に影響を与えます。信頼性を実現するには、特定のパターンに従う必要があります。

信頼性の柱は、次の主要分野に焦点を当てています。

  • サービスクォータやデプロイパターンなどのワークロードアーキテクチャ

  • InfluxDB インスタンスの管理とスケーリング

サービスクォータやデプロイパターンなどのワークロードアーキテクチャ

各 AWS アカウント には、各 で提供されるリソースのクォータがあります AWS リージョン。たとえば、各リージョンには、インスタンスサイズに関係なく、InfluxDB インスタンスの Timestream のクォータがあります。リージョン内のインスタンスの最大数に達すると、インスタンスを作成するための追加の呼び出しは例外で失敗します。InfluxDB インスタンスストレージボリュームの Timestream は、サポートされているすべての で最大サイズ 16 テビバイト (TiBs) まで拡張できます AWS リージョン。

デプロイパターン

InfluxDB インスタンスの Timestream の高可用性とフェイルオーバーのサポートのために、単一のスタンバイ DB インスタンスでマルチ AZ 配置を使用できます。このタイプのデプロイは、マルチ AZ DB インスタンスのデプロイと呼ばれます。Amazon Timestream for InfluxDB は、Amazon フェイルオーバーテクノロジーを使用します。マルチ AZ DB インスタンスのデプロイでは、Amazon Timestream は別のアベイラビリティーゾーンに同期スタンバイレプリカを自動的にプロビジョニングして維持します。データの冗長性を提供するために、プライマリ DB インスタンスはアベイラビリティーゾーン間でスタンバイレプリカに同期的にレプリケートされます。

高可用性で DB インスタンスを実行すると、DB インスタンスの障害時やアベイラビリティーゾーンの中断時に可用性が提供される可能性があります。DB インスタンスの予期しない停止がインフラストラクチャの不具合に起因する場合、Amazon Timestream for InfluxDB は自動的にスタンバイレプリカに切り替わります。フェイルオーバーが完了するまでにかかる時間は、プライマリ DB インスタンスが使用できなくなったときのデータベースアクティビティおよびその他の条件によって異なります。

フェイルオーバー時間は通常 60~120 秒です。ただし、カーディナリティの高いデータを含む大規模なトランザクションや、ウォームアップ前の要件を含む長い復旧プロセスでは、フェイルオーバー時間が長くなる可能性があります。フェイルオーバーが完了したら、Timestream コンソールに新しいアベイラビリティーゾーンが反映されるまでに追加の時間が必要になる場合があります。

完全な AWS リージョン 停止中にアプリケーションを使用できるようにする必要がある場合は、ディザスタリカバリ (DR) プランの一部としてレプリケーションを設定するか、別のリージョンに書き込むことを検討してください。ただし、レプリケーションを設定する前に、必ず制限事項を理解してください。詳細については、InfluxDB ドキュメントを参照してください。

Amazon Timestream for InfluxDB は、可用性と耐久性をサポートするために、内部バックアップを定期的に取得し、24 時間保持します。スナップショットは削除中に作成され、復元をサポートするために 30 日間保持されます。これらにアクセスまたは使用するには、 でケースを作成しますAWS サポート

InfluxDB の Timestream を管理およびスケーリングする

InfluxDB の Timestream は、オープンソースの InfluxDB データベースでメモリを大量に消費するワークロードを実行するのに最適なインスタンスクラスをサポートしています。異なる db.influx インスタンスクラスには、vCPUsメモリ、ストレージ、ネットワーク帯域幅に制限があります。アプリケーションの書き込みおよびクエリのレイテンシー要件に適したインスタンスクラスを選択するには、テスト中に Amazon CloudWatch CPUUtilizationMemoryUtilization、および DiskUtilizationメトリクスを確認します。ワークロードの要件に基づいて、インスタンスをスケールアップまたはスケールダウンできます。InfluxDB の Timestream は、さまざまなタイプのワークロードに必要な最適な IOPS とスループットで事前設定された複数のストレージ層を提供します。要件に基づいて、ワークロードに最適なものを選択します。

スケーリングのニーズが予測可能な時間に変化する場合は、 AWS Lambda 関数またはカスタムスケジューラを使用して API または SDK を実行して、バッファ時間を指定してスケールアップおよびスケールダウンできます。

パラメータグループのパラメータを使用して、Timestream for InfluxDB で InfluxDB InfluxDB 設定を管理します。パラメータグループは、1 つ以上の DB インスタンスに適用される InfluxDB 設定オプションのコンテナとして機能します。パラメータグループのパラメータを変更するときは、静的パラメータと動的パラメータの違いと、それらを適用する方法とタイミングを理解します。現在適用されている設定を確認するには、GetDbParameterGroup API アクションを使用します。