高可用性は災害対策ではない - AWS でのワークロードの災害対策: クラウド内での復旧

高可用性は災害対策ではない

可用性と災害対策は、両方ともいくつかの同じベストプラクティス (障害のモニタリング、複数箇所へのデプロイ、自動フェイルオーバーなど) に依存しています。ただし、可用性はワークロードのコンポーネントに重点を置き、災害対策はワークロード全体の個別のコピーに重点を置いています。災害対策と可用性では目標が異なり、災害対策は災害に該当する大規模なイベントの発生から復旧するまでの時間を測定します。まず、ワークロードが可用性の目標を満たしていることを確認する必要があります。高可用性のアーキテクチャであれば、可用性に影響するイベントが発生した場合でも、お客様のニーズを満たすことができます。災害対策戦略では、可用性に対するアプローチとは異なるアプローチが必要であり、複数の場所に個別のシステムをデプロイし、必要に応じてワークロード全体をフェイルオーバーできることが重要です。

災害対策計画では、ワークロードの可用性を考慮する必要があります。可用性は、使用するアプローチに影響するためです。1 つのアベイラビリティーゾーン内の 1 つの Amazon EC2 インスタンスで実行されるワークロードには、高可用性がありません。地域で洪水が発生してアベイラビリティーゾーンが影響を受けた場合、このシナリオでは別の AZ にフェイルオーバーして DR の目標を達成する必要があります。このシナリオを、マルチサイト アクティブ/アクティブにデプロイした高可用性ワークロードと比較してください。マルチサイト アクティブ/アクティブでは、ワークロードを複数のアクティブなリージョンにデプロイし、すべてのリージョンで本番トラフィックを処理します。この場合、大規模な災害によってリージョン全体が破壊されたとしても、すべてのトラフィックを残りのリージョンにルーティングすることで DR 戦略が達成されます。

データへのアプローチ方法も、可用性と災害対策では異なります。高可用性を実現するには、別のサイトに継続的にレプリケートするストレージソリューション (マルチサイト アクティブ/アクティブワークロードなど) を検討します。プライマリストレージデバイス上で 1 つまたは複数のファイルが削除または破損すると、これらの破壊的な変更がセカンダリストレージデバイスにレプリケートされる場合があります。このシナリオでは、高可用性にもかかわらず、データの削除や破損に伴うフェイルオーバー機能が損なわれます。代わりに、DR 戦略の一環としてポイントインタイムバックアップも必要です。