Mountpoint の設定と使用 - Amazon Simple Storage Service

Mountpoint の設定と使用

Mountpoint for Amazon S3 を使用するには、ホストに AWS マウントしたい 1 つまたは複数のバケットにアクセスできる認証情報が必要です。さまざまな認証方法については、GitHub の「Mountpoint AWS 認証情報」を参照してください。

たとえば、新しい AWS Identity and Access Management (IAM) ユーザーとロールをこの目的を作成できます。このロールに、マウントしたい 1 つまたは複数のバケットへのアクセス権があることを確認してください。インスタンスプロファイルを使って、IAM ロールを Amazon EC2 インスタンスに渡すことができます。

Mountpoint for Amazon S3 の使用

Mountpoint for Amazon S3 を使用して次の操作を行います。

  1. mount-s3 コマンドを使用してバケットをマウントします。

    以下の例では、DOC-EXAMPLE-BUCKET を S3 バケットの名前に置き換え、~/mnt を S3 バケットをマウントしたいホスト上のディレクトリに置き換えます。

    mkdir ~/mnt mount-s3 DOC-EXAMPLE-BUCKET ~/mnt

    デフォルトでは Mountpoint クライアントがバックグラウンドで実行されるため、~/mnt ディレクトリから S3 バケット内のオブジェクトにアクセスできるようになりました。

  2. Mountpoint を通じてバケット内のオブジェクトにアクセスします。

    バケットをローカルにマウントしたら、cat や ls などの一般的な Linux コマンドして、S3 オブジェクトを操作することができます。Amazon S3 の Mountpoint は、S3 バケット内のキーをフォワードスラッシュ (/) 文字で分割することでファイルシステムパスとして解釈します。たとえば、Data/2023-01-01.csv バケットにオブジェクトキーがある場合、Mountpoint ファイルに Data という名前のディレクトリがあり、その中には 2023-01-01.csv という名前のファイルがあります。

    Mountpoint for Amazon S3 は、ファイルシステムに意図的に完全な POSIX 標準仕様を実装していません。Mountpoint は、ファイルシステムインターフェイスを通じて Amazon S3 に保存されているデータへの高スループットの読み取り/書き込みアクセスを必要しながらも、それ以外はファイルシステム機能に依存しないワークロード向けに最適化されています。詳細については、GitHub の「Mountpoint for Amazon S3 ファイルシステムの動作」を参照してください。より豊富なファイルシステムセマンティクスを必要とするお客様は、他の AWS ファイルサービス (例: Amazon Elastic File System (Amazon EFS) または Amazon FSx) などを検討してください。

  3. umount コマンドを使用してバケットをアンマウントします。このコマンドは S3 バケットをアンマウントし、マウントポイントを終了します。

    以下のコマンド例を使用するには、~/mnt を S3 バケットがマウントされているホスト上のディレクトリに置き換えます。

    umount ~/mnt
    注記

    このコマンドのオプションのリストを取得するには、umount --help を実行します。

マウントポイント設定の詳細については、GitHub の「S3 バケット設定、およびファイルシステムの設定」を参照してください。

Mountpoint でのキャッシュの設定

Mountpoint for Amazon S3 を使用する場合、S3 バケットから最近アクセスされたデータを Amazon EC2 インスタンスストレージまたはアタッチされた Amazon EBS ボリュームにキャッシュするように設定できます。このようなデータをキャッシュすると、パフォーマンスの向上、データの繰り返しアクセスのコスト削減につながります。Mountpoint でのキャッシュは、複数の読み取り中に変更されない同じデータを繰り返し読み取るユースケースに最適です。たとえば、モデルの精度を向上させるためにトレーニングデータセットを複数回読み取る必要がある機械学習トレーニングジョブでキャッシュを使用できます。

S3 バケットをマウントする場合、オプションでフラグを使用してキャッシュを有効にできます。データキャッシュの場所とサイズ、メタデータをキャッシュに保持する期間を設定できます。バケットをマウントしてキャッシュを有効にすると、Mountpoint は設定したキャッシュの場所に空のサブディレクトリを作成します (このサブディレクトリがまだ存在しない場合)。最初にバケットをマウントする際、またマウントを解除する際、Mountpoint はキャッシュロケーションのコンテンツを削除します。Mountpoint でのキャッシュの設定と使用の詳細については、GitHub の「Mountpoint for Amazon S3 Caching configuration」を参照してください。

S3 バケットをマウントすると、--cache CACHE_PATH フラグを使用してキャッシュを有効にできます。次の例の、CACHE_PATH は、データをキャッシュするディレクトリへのファイルパスに置き換えます。DOC-EXAMPLE-BUCKET は S3 バケット名に置き換え、~/mnt を S3 バケットをマウントするホスト上のディレクトリに置き換えます。

mkdir ~/mnt mount-s3 --cache CACHE_PATH DOC-EXAMPLE-BUCKET ~/mnt
重要

キャッシュを有効にすると、Mountpoint は、S3 バケットの暗号化されていないオブジェクトのコンテンツを、マウント時に設定したキャッシュの場所に保持します。データを保護するために、データキャッシュの場所へのアクセスを制限することをお勧めします。