Configurar e usar o Mountpoint - Amazon Simple Storage Service

Configurar e usar o Mountpoint

Para usar o Mountpoint para Amazon S3, o host precisa de credenciais válidas da AWS, com acesso ao bucket ou aos buckets que você gostaria de montar. Para diferentes formas de autenticação, consulte Credenciais da AWS para o Mountpoint no GitHub.

Por exemplo, você pode criar um usuário e um perfil do AWS Identity and Access Management (IAM) para essa finalidade. Esse perfil deve ter acesso ao bucket ou aos buckets que você gostaria de montar. É possível transmitir o perfil do IAM à instância do Amazon EC2 com um perfil de instância.

Usar o Mountpoint para Amazon S3

Use o Mountpoint para Amazon S3 para fazer o seguinte:

  1. Montar buckets com o comando mount-s3.

    No exemplo a seguir, substitua DOC-EXAMPLE-BUCKET pelo nome do bucket do S3 e substitua ~/mnt pelo diretório no host em que você deseja montar o bucket do S3.

    mkdir ~/mnt mount-s3 DOC-EXAMPLE-BUCKET ~/mnt

    Como o cliente do Mountpoint é executado em segundo plano por padrão, o diretório ~/mnt agora fornece acesso aos objetos no bucket do S3.

  2. Acesse os objetos no bucket por meio do Mountpoint.

    Depois de montar o bucket localmente, você pode usar os comandos Linux comuns, como cat ou ls, para trabalhar com os objetos do S3. O Mountpoint para Amazon S3 interpreta as chaves no bucket do S3 como caminhos do sistema de arquivos dividindo-as com o caractere de barra (/). Por exemplo, se você tiver a chave do objeto Data/2023-01-01.csv no bucket, terá um diretório chamado Data no sistema de arquivos do Mountpoint, o qual contém um arquivo chamado 2023-01-01.csv.

    O Mountpoint para Amazon S3 não implementa intencionalmente a especificação padrão completa POSIX para sistemas de arquivos. O Mountpoint é otimizado para workloads que, embora precisem de alta taxa de throughput para acesso de leitura e gravação aos dados armazenados no Amazon S3 por meio de uma interface de sistema de arquivos, de outra forma não dependem dos atributos do sistema de arquivos. Para receber mais informações, consulte Comportamento do sistema de arquivos do Mountpoint para Amazon S3 no GitHub. Os clientes que precisam de uma semântica mais completa do sistema de arquivos devem considerar outros serviços de arquivos AWS, como Amazon Elastic File System (Amazon EFS) ou Amazon FSx.

  3. Desmonte o bucket usando o comando umount. Esse comando desmonta o bucket do S3 e sai do Mountpoint.

    Para usar o comando de exemplo a seguir, substitua ~/mnt pelo diretório no host em que o bucket do S3 está montado.

    umount ~/mnt
    nota

    Para receber uma lista de opções para esse comando, execute umount --help.

Para receber detalhes adicionais sobre a configuração do Mountpoint, consulte Configuração do bucket do S3 e Configuração do sistema de arquivos no GitHub.

Configurar o armazenamento em cache no Mountpoint

Ao usar o Mountpoint para Amazon S3, você pode configurá-lo para armazenar em cache os dados acessados mais recentemente dos buckets do S3 no armazenamento de instâncias do Amazon EC2 ou em um volume anexado do Amazon EBS. Armazenar esses dados em cache pode ajudar a acelerar a performance e reduzir o custo do acesso repetido aos dados. O armazenamento em cache no Mountpoint é ideal para casos de uso em que você lê repetidamente os mesmos dados que não mudam durante as várias leituras. Por exemplo, você pode usar o armazenamento em cache com trabalhos de treinamento de machine learning que precisam ler um conjunto de dados de treinamento várias vezes para melhorar a precisão do modelo.

Ao montar um bucket do S3, você também pode habilitar o armazenamento em cache por meio de sinalizadores. É possível configurar a localização e o tamanho do cache de dados e a quantidade de tempo em que os metadados são retidos no cache. Quando você monta um bucket e o armazenamento em cache é habilitado, o Mountpoint cria um subdiretório vazio no local do cache configurado, caso esse subdiretório ainda não exista. Quando você monta um bucket pela primeira vez e quando desmonta, o Mountpoint exclui o conteúdo da localização do cache. Para obter mais informações sobre como configurar e usar o armazenamento em cache no Mountpoint, consulte Mountpoint for Amazon S3 Caching configuration no GitHub.

Ao montar um bucket do S3, você pode habilitar o armazenamento em cache com o sinalizador --cache CACHE_PATH. No exemplo a seguir, substitua CACHE_PATH pelo caminho de arquivo do diretório no qual você deseja armazenar os dados em cache. Substitua DOC-EXAMPLE-BUCKET pelo nome do bucket do S3 e substitua ~/mnt pelo diretório no host em que você deseja montar o bucket do S3.

mkdir ~/mnt mount-s3 --cache CACHE_PATH DOC-EXAMPLE-BUCKET ~/mnt
Importante

Se você habilitar o armazenamento em cache, o Mountpoint manterá o conteúdo de objeto não criptografado do bucket do S3 no local de armazenamento em cache configurado na montagem. Para proteger os dados, recomendamos que você restrinja o acesso ao local do cache de dados.