ストレージアーキテクチャの選択
特定のシステムに最適なストレージソリューションは、アクセス方法 (ブロック、ファイル、またはオブジェクト)、アクセスパターン (ランダムまたはシーケンシャル)、必要なスループット、アクセス頻度 (オンライン、オフライン、アーカイブ)、更新頻度 (WORM、動的)、および可用性と耐久性に関する制約に応じて異なります。優れた設計のシステムでは、複数のストレージソリューションを使用し、さまざまな機能を有効にしてパフォーマンスを向上させます。
AWS ではストレージが仮想化されており、多数の異なるタイプのストレージを利用できます。これは、ユーザーのニーズとストレージ方法の一致を容易にし、オンプレミスのインフラストラクチャでは実現が難しいストレージオプションを提供します。例えば Amazon S3 は、99.999999999% (イレブンナイン) の耐久性を実現するよう設計されています。磁気ハードディスクドライブ (HDD) の使用から SSD への変更も可能で、仮想ドライブはひとつのインスタンスから別のインスタンスに数秒間で簡単に移動できます。
スループット、1 秒あたりの入出力オペレーション (IOPS)、レイテンシーを確認することでパフォーマンスを測定できます。それらの測定値の関係を理解することにより、最も適切なストレージソリューションが選択できるようになります。
ストレージ |
サービス |
レイテンシー |
スループット |
共有可能な |
---|---|---|---|---|
ブロック |
Amazon EBS |
最小、一貫的 |
単一 |
EC2 インスタンスにマウント、スナップショット経由のコピー |
ファイルシステム |
小、一貫的 |
複数の |
多数のクライアント |
|
オブジェクト |
低レイテンシー |
ウェブスケール |
多数のクライアント |
|
アーカイブ |
数分~数時間 |
高 |
いいえ |
レイテンシーの観点から、データが 1 つのインスタンスからしかアクセスされない場合は Amazon EBS などのブロックストレージを使用するようにしてください。通常、Amazon EFS などの分散ファイルシステムでは、それぞれのファイル操作のレイテンシーオーバーヘッドが小さいため、複数のインスタンスでアクセスが必要な場合に使用されるべきです。
Amazon S3 には、レイテンシーを減らし、スループットを増やす機能があります。クロスリージョンレプリケーション (CRR) を使用すると、さまざまなリージョンに低レイテンシーのデータアクセスが実現します。
スループットの観点からみると、Amazon EFS は、高度な並列化ワークロード (複数のスレッドと EC2 インスタンスから同時操作を使用するなど) をサポートします。これにより、全体的なスループットと 1 秒あたりのオペレーションのレベルを上げることができます。Amazon EFS では、ベンチマークやロードテストを使用して適切なパフォーマンスモードを選択します。