Desempenho do Amazon FSx for Lustre - FSxpara Lustre

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Desempenho do Amazon FSx for Lustre

O Amazon FSx for Lustre, baseado no Lustre, o popular sistema de arquivos de alto desempenho, oferece desempenho escalável que aumenta linearmente com o tamanho do sistema de arquivos. Os sistemas de arquivos do Lustre são escalados horizontalmente em diversos servidores de arquivos e discos. Essa escalabilidade disponibiliza a todos os clientes o acesso direto aos dados armazenados em cada disco para remover muitos dos gargalos presentes nos sistemas de arquivos tradicionais. O Amazon FSx for Lustre se baseia na arquitetura escalável do Lustre para oferecer suporte a altos níveis de desempenho em um grande número de clientes.

Como funcionam FSx os sistemas de arquivos Lustre

Cada sistema FSx de arquivos do Lustre consiste nos servidores de arquivos com os quais os clientes se comunicam e em um conjunto de discos conectados a cada servidor de arquivos que armazena seus dados. Cada servidor de arquivos emprega um cache na memória rápido para aprimorar a performance dos dados acessados ​​com mais frequência. HDDsistemas de arquivos baseados também podem ser provisionados com um cache de leitura SSD baseado para melhorar ainda mais o desempenho dos dados acessados com mais frequência. Quando um cliente acessa dados armazenados na memória ou no SSD cache, o servidor de arquivos não precisa lê-los do disco, o que reduz a latência e aumenta a quantidade total de taxa de transferência que você pode gerar. O diagrama a seguir ilustra os caminhos de uma operação de gravação, uma operação de leitura fornecida pelo disco e uma operação de leitura fornecida pela memória ou SSD pelo cache.

FSxpara a arquitetura de desempenho Lustre.

Quando você lê dados armazenados na memória ou no SSD cache do servidor de arquivos, o desempenho do sistema de arquivos é determinado pela taxa de transferência da rede. Quando você grava dados no sistema de arquivos ou quando realiza a leitura de dados que não estão armazenados no cache na memória, a performance do sistema de arquivos é determinada pelo menor throughput da rede e do disco.

Quando você provisiona um sistema de arquivos HDD Lustre com um SSD cache, a Amazon FSx cria um SSD cache que é automaticamente dimensionado para 20% da capacidade de HDD armazenamento do sistema de arquivos. Isso fornece latências inferiores a um milissegundo ou mais IOPS para arquivos acessados com frequência.

Performance do sistema de arquivos agregados

A taxa de transferência que um sistema de arquivos FSx for Lustre suporta é proporcional à sua capacidade de armazenamento. Os sistemas de arquivos Amazon FSx for Lustre escalam para centenas de taxas GBps de transferência e milhões de. IOPS O Amazon FSx for Lustre também oferece suporte ao acesso simultâneo ao mesmo arquivo ou diretório a partir de milhares de instâncias computacionais. Esse acesso permite a rápida verificação de dados da memória do aplicativo ao armazenamento, que é uma técnica comum na computação de alto desempenho (HPC). Você podel aumentar a quantidade de armazenamento e a capacidade de throughput, conforme necessário, a qualquer momento após a criação do sistema de arquivos. Para obter mais informações, consulte Como gerenciar a capacidade de armazenamento.

FSxOs sistemas de arquivos for Lustre fornecem taxa de transferência de leitura contínua usando um mecanismo de crédito de E/S de rede para alocar a largura de banda da rede com base na utilização média da largura de banda. Os sistemas de arquivos acumulam créditos quando o uso da largura de banda da rede está abaixo dos limites da linha de base e esses créditos podem ser usados na execução de transferências de dados pela rede.

As tabelas a seguir mostram o desempenho FSx para o qual as opções de implantação do Lustre foram projetadas.

Desempenho do sistema de arquivos para opções SSD de armazenamento
Tipo de implantação Throughput da rede (MB/s/TiB de armazenamento provisionado) Rede IOPS (IOPS/TiB de armazenamento provisionado) Armazenamento em cache (GiB RAM de/TiB de armazenamento provisionado) Latências do disco por operação de arquivo (milissegundos, P50) Taxa de transferência de disco (MBps/TiB de armazenamento ou SSD cache provisionado)

Linha de base

Intermitência

Linha de base

Intermitência

SCRATCH_2 200 1300

Linha de base de dezenas de milhares

Intermitência de centenas de milhares

6.7

Metadados: inferiores a um milissegundo

Dados: inferiores a um milissegundo

200 (leitura)

100 (gravação)

PERSISTENT-125 320 1300 3.4

125

500
PERSISTENT-250 640 1300 6.8

250

500
PERSISTENT-500 1300 13.7 500

PERSISTENT-1000 2600 27,3 1000
Desempenho do sistema de arquivos para opções HDD de armazenamento
Tipo de implantação Taxa de transferência da rede (MB/s/TiB de armazenamento ou cache provisionado) SSD Rede IOPS (IOPS/TiB de armazenamento provisionado) Armazenamento em cache (GiB RAM de/TiB de armazenamento provisionado) Latências do disco por operação de arquivo (milissegundos, P50) Taxa de transferência de disco (MBps/TiB de armazenamento ou SSD cache provisionado)

Linha de base

Intermitência

Linha de base

Intermitência

PERSISTENT-12
HDDarmazenamento 40 375*

Linha de base de dezenas de milhares

Intermitência de centenas de milhares

0,4 memória

Metadados: inferiores a um milissegundo

Dados: milissegundo de um dígito

12

80 (leitura)

50 (gravação)

SSDcache de leitura

200

1.900

200 de SSD cache

Dados: inferiores a um milissegundo

200

-

PERSISTENT-40
HDDarmazenamento 150 1.300*

Linha de base de dezenas de milhares

Intermitência de centenas de milhares

1.5

Metadados: inferiores a um milissegundo

Dados: milissegundo de um dígito

40

250 (leitura)

150 (gravação)

SSDcache de leitura

750

6500

200 de SSD cache

Dados: inferiores a um milissegundo

200

-

Desempenho do sistema de arquivos para opções SSD de armazenamento da geração anterior
Tipo de implantação Throughput da rede (MB/s por TiB de armazenamento provisionado) Rede IOPS (IOPSpor TiB de armazenamento provisionado) Armazenamento em cache (GiB por TiB de armazenamento provisionado) Latências do disco por operação de arquivo (milissegundos, P50) Taxa de transferência de disco (MB/s por TiB de armazenamento ou cache provisionado) SSD

Linha de base

Intermitência

Linha de base

Intermitência

PERSISTENT-50 250 1.300*

Linha de base de dezenas de milhares

Intermitência de centenas de milhares

2.2 RAM

Metadados: inferiores a um milissegundo

Dados: inferiores a um milissegundo

50

240

PERSISTENT-100 500 1.300* 4.4 RAM 100 240
PERSISTENT-200 750 1.300* 8.8 RAM 200 240
nota

*Os sistemas de arquivos persistentes a seguir Regiões da AWS fornecem intermitência de rede de até 530 MB/s por TiB de armazenamento: África (Cidade do Cabo), Ásia-Pacífico (Hong Kong), Ásia-Pacífico (Osaka), Ásia-Pacífico (Cingapura), Canadá (Central), Europa (Frankfurt), Europa (Londres), Europa (Milão), Europa (Estocolmo), Oriente Médio (Bahrein), América do Sul (São Paulo), China e EUA Oeste (Los Angeles).

Exemplo: linha de base agregada e throughput de intermitência

O exemplo apresentado a seguir ilustra como a capacidade de armazenamento e o throughput do disco afetam a performance do sistema de arquivos.

Um sistema de arquivos persistente com capacidade de armazenamento de 4,8 TiB e 50 MB/s por TiB de throughput por unidade de armazenamento fornece um throughput do disco de linha de base agregada de 240 MB/s e um throughput do disco de intermitência de 1,152 GB/s.

Independentemente do tamanho do sistema de arquivos, o Amazon FSx for Lustre fornece latências consistentes de menos de um milissegundo para operações de arquivos.

Desempenho de metadados do sistema de arquivos

As operações de E/S de metadados do sistema de arquivos por segundo (IOPS) determinam o número de arquivos e diretórios que você pode criar, listar, ler e excluir por segundo. IOPSOs metadados são provisionados automaticamente FSx para os sistemas de arquivos Lustre com base na capacidade de armazenamento que você provisiona.

Os sistemas de arquivos Persistent_2 permitem que você provisione metadados IOPS independentemente da capacidade de armazenamento e forneça maior visibilidade sobre o número e o tipo de metadados que as instâncias do IOPS cliente estão gerando em seu sistema de arquivos.

Com FSx os sistemas de arquivos Lustre Persistent_2, o número de metadados IOPS que você provisiona e o tipo de operação de metadados determinam a taxa de operações de metadados que seu sistema de arquivos pode suportar. O nível de metadados IOPS que você provisiona determina o número de IOPS provisionados para os discos de metadados do seu sistema de arquivos.

Tipo de operação Operações que você pode conduzir por segundo para cada metadado provisionado IOPS

Criar, abrir e fechar arquivos

2

Excluir arquivo

1

Criar e renomear diretórios

0.1

Excluir diretório

0.2

Você pode optar por provisionar metadados IOPS usando o modo automático ou o modo provisionado pelo usuário. No modo Automático, a Amazon provisiona FSx automaticamente os metadados IOPS com base na capacidade de armazenamento do seu sistema de arquivos, de acordo com a tabela abaixo:

Capacidade de armazenamento do sistema de arquivos Metadados incluídos IOPS no modo automático

1200 GiB

1500

2400 GiB

3000

4800—9600 GiB

6000

12000—45600 GiB

12000

≥48000 GiB

12.000 IOPS por 24.000 GiB

No modo provisionado pelo usuário, você pode optar por especificar o número de metadados a serem provisionados. IOPS Você paga pelos metadados IOPS provisionados acima do número padrão de metadados do seu sistema IOPS de arquivos.

Layout de armazenamento do sistema de arquivos

Todos os dados do arquivo no Lustre são armazenados em volumes de armazenamento chamados de destinos de armazenamento de objetos (OSTs). Todos os metadados do arquivo (incluindo nomes de arquivos, registros de data e hora, permissões e muito mais) são armazenados em volumes de armazenamento chamados de destinos de metadados (). MDTs Os sistemas de arquivos Amazon FSx for Lustre são compostos por um ou mais MDTs e váriosOSTs. Cada um OST tem aproximadamente 1 a 2 TiB de tamanho, dependendo do tipo de implantação do sistema de arquivos. O Amazon FSx for Lustre distribui seus dados de arquivos pelos OSTs que compõem seu sistema de arquivos para equilibrar a capacidade de armazenamento com a taxa de transferência e a carga. IOPS

Para ver o uso de armazenamento do MDT e OSTs que compõem seu sistema de arquivos, execute o comando a seguir em um cliente que tenha o sistema de arquivos montado.

lfs df -h mount/path

A saída deste comando é semelhante à apresentada a seguir.

UUID bytes Used Available Use% Mounted on mountname-MDT0000_UUID 68.7G 5.4M 68.7G 0% /fsx[MDT:0] mountname-OST0000_UUID 1.1T 4.5M 1.1T 0% /fsx[OST:0] mountname-OST0001_UUID 1.1T 4.5M 1.1T 0% /fsx[OST:1] filesystem_summary: 2.2T 9.0M 2.2T 0% /fsx

Distribuição de dados no sistema de arquivos

É possível otimizar a performance de throughput do seu sistema de arquivos com a distribuição de arquivos. O Amazon FSx for Lustre distribui automaticamente os arquivos para garantir que os dados sejam fornecidos por todos os servidores de armazenamento. OSTs Você pode aplicar o mesmo conceito no nível do arquivo configurando como os arquivos são distribuídos em vários. OSTs

O striping significa que os arquivos podem ser divididos em vários blocos que são armazenados em diferentes partes. OSTs Quando um arquivo é dividido em váriosOSTs, as solicitações de leitura ou gravação do arquivo são distribuídas entre elesOSTs, aumentando a taxa de transferência agregada ou que IOPS seus aplicativos podem passar por ela.

A seguir estão os layouts padrão dos sistemas de arquivos Amazon FSx for Lustre.

  • Para sistemas de arquivos criados antes de 18 de dezembro de 2020, o layout padrão especifica uma contagem de distribuição de um. Isso significa que, a menos que um layout diferente seja especificado, cada arquivo criado no Amazon FSx for Lustre usando ferramentas Linux padrão é armazenado em um único disco.

  • Para sistemas de arquivos criados após 18 de dezembro de 2020, o layout padrão corresponde a um layout de arquivos progressivo, no qual arquivos com tamanhos inferiores a 1 GiB são armazenados em uma distribuição e arquivos com tamanhos superiores são atribuídos a uma contagem de distribuição de cinco.

  • Para sistemas de arquivos criados após 25 de agosto de 2023, o layout padrão corresponde a um layout de arquivos progressivo de quatro componentes, o qual é explicado em Layouts de arquivos progressivos.

  • Para todos os sistemas de arquivos, independentemente da data de criação, os arquivos importados do Amazon S3 não usam o layout padrão. Eles usam o layout presente no parâmetro ImportedFileChunkSize do sistema de arquivos. Arquivos importados para S3 maiores que o ImportedFileChunkSize serão armazenados em vários OSTs com uma contagem de faixas de. (FileSize / ImportedFileChunksize) + 1 O valor padrão de ImportedFileChunkSize é 1 GiB.

É possível visualizar a configuração de layout de um arquivo ou de um diretório usando o comando lfs getstripe.

lfs getstripe path/to/filename

Este comando informa a contagem de distribuição, o tamanho da distribuição e o deslocamento da distribuição de um arquivo. A contagem de faixas é quantas faixas OSTs o arquivo está distribuído. O tamanho da faixa é a quantidade de dados contínuos armazenados em umOST. O deslocamento da faixa é o índice do primeiro em OST que o arquivo é distribuído.

Modificação da configuração de distribuição

Os parâmetros de layout de um arquivo são definidos quando o arquivo é criado pela primeira vez. Use o comando lfs setstripe para criar um arquivo novo e em branco com um layout especificado.

lfs setstripe filename --stripe-count number_of_OSTs

O comando lfs setstripe afeta somente o layout de um novo arquivo. Use-o para especificar o layout de um arquivo antes de criá-lo. Você também pode definir um layout para um diretório. Após ser definido em um diretório, esse layout é aplicado a cada novo arquivo adicionado ao diretório, mas não aos arquivos existentes. Qualquer novo subdiretório criado também herdará o novo layout, que será aplicado a qualquer novo arquivo ou diretório criado nesse subdiretório.

Para modificar o layout de um arquivo existente, use o comando lfs migrate. Este comando copia o arquivo, conforme necessário, para distribuir o conteúdo de acordo com o layout especificado no comando. Por exemplo, arquivos anexados ou aumentados em tamanho não alteram a contagem de distribuição, portanto, é necessário migrá-los para alterar o layout do arquivo. Como alternativa, é possível criar um novo arquivo usando o comando lfs setstripe para especificar o layout, copiar o conteúdo original para o novo arquivo e, em seguida, renomear o novo arquivo para substituir o arquivo original.

Pode haver casos em que a configuração de layout padrão não seja ideal para a workload. Por exemplo, um sistema de arquivos com dezenas OSTs e um grande número de arquivos de vários gigabytes pode ter um desempenho melhor ao distribuir os arquivos em mais do que o valor padrão de contagem de faixas de cinco. OSTs A criação de arquivos grandes com baixa contagem de faixas pode causar gargalos no desempenho de E/S e também pode causar o preenchimento. OSTs Nesse caso, você pode criar um diretório com uma contagem de distribuição maior para esses arquivos.

Configurar um layout distribuído para arquivos grandes (especialmente arquivos maiores que um gigabyte) é importante pelos seguintes motivos:

  • Melhora a taxa de transferência ao permitir que vários servidores OSTs e seus associados contribuamIOPS, a largura de banda da rede e CPU os recursos ao ler e gravar arquivos grandes.

  • Reduz a probabilidade de um pequeno subconjunto OSTs se tornar pontos críticos que limitam o desempenho geral da carga de trabalho.

  • Impede que um único arquivo grande preencha umOST, possivelmente causando erros de disco cheio.

Não existe uma configuração única de layout que seja ideal para todos os casos de uso. Para obter orientação detalhada sobre os layouts de arquivos, consulte Managing File Layout (Striping) and Free Space na documentação do Lustre.org. A seguir, apresentamos as diretrizes gerais:

  • O layout distribuído é mais importante para arquivos grandes, especialmente para casos de uso em que os arquivos têm regularmente centenas de megabytes ou mais. Por esse motivo, o layout padrão para um novo sistema de arquivos atribui uma contagem de distribuição de cinco para arquivos com tamanho superior a 1 GiB.

  • A contagem de distribuição é o parâmetro de layout que você deve ajustar para sistemas que oferecem suporte a arquivos grandes. A contagem de faixas especifica o número de OST volumes que conterão partes de um arquivo listrado. Por exemplo, com uma contagem de faixas de 2 e um tamanho de faixa de 1 MiB, o Lustre grava partes alternativas de 1 MiB de um arquivo em cada um dos dois. OSTs

  • A contagem efetiva de faixas é menor entre o número real de OST volumes e o valor da contagem de faixas que você especificar. Você pode usar o valor especial de contagem de faixas -1 para indicar que as faixas devem ser colocadas em todos os OST volumes.

  • Definir uma grande contagem de faixas para arquivos pequenos não é o ideal porque, para determinadas operações, o Lustre exige uma viagem de ida e volta à rede para cada OST parte do layout, mesmo que o arquivo seja pequeno demais para consumir espaço em todos os volumes. OST

  • Você pode configurar um layout de arquivo progressivo (PFL) que permite que o layout de um arquivo mude com o tamanho. Uma PFL configuração pode simplificar o gerenciamento de um sistema de arquivos que tenha uma combinação de arquivos grandes e pequenos sem que você precise definir explicitamente uma configuração para cada arquivo. Para obter mais informações, consulte Layouts de arquivos progressivos.

  • Por padrão, o tamanho da distribuição é 1 MiB. A definição de um deslocamento de distribuição pode ser útil em circunstâncias especiais, mas, em geral, é melhor deixá-lo sem especificação e usar o padrão.

Layouts de arquivos progressivos

Você pode especificar uma configuração progressiva de layout de arquivo (PFL) para um diretório para especificar diferentes configurações de distribuição para arquivos pequenos e grandes antes de preenchê-lo. Por exemplo, você pode definir a PFL no diretório de nível superior antes que qualquer dado seja gravado em um novo sistema de arquivos.

Para especificar uma PFL configuração, use o lfs setstripe comando com -E opções para especificar componentes de layout para arquivos de tamanhos diferentes, como o comando a seguir:

lfs setstripe -E 100M -c 1 -E 10G -c 8 -E 100G -c 16 -E -1 -c 32 /mountname/directory

Este comando define quatro componentes de layout:

  • O primeiro componente (-E 100M -c 1) indica um valor de contagem de distribuição de 1 para arquivos de até 100 MiB de tamanho.

  • O segundo componente (-E 10G -c 8) indica uma contagem de distribuição de 8 para arquivos de até 10 GiB de tamanho.

  • O terceiro componente (-E 100G -c 16) indica uma contagem de distribuição de 16 para arquivos de até 100 GiB de tamanho.

  • O quarto componente (-E -1 -c 32) indica uma contagem de distribuição de 32 para arquivos com tamanho superior a 100 GiB.

Importante

Anexar dados a um arquivo criado com um PFL layout preencherá todos os componentes do layout. Por exemplo, com o comando de 4 componentes mostrado acima, se você criar um arquivo de 1 MiB e adicionar dados ao final dele, o layout do arquivo se expandirá para ter uma contagem de faixas de -1, ou seja, todas as OSTs do sistema. Isso não significa que os dados serão gravados em todosOST, mas uma operação como a leitura do tamanho do arquivo enviará uma solicitação paralelamente a cada umOST, adicionando uma carga de rede significativa ao sistema de arquivos.

Portanto, tome cuidado em relação a limitar a contagem de distribuição para qualquer arquivo pequeno ou médio que possa, posteriormente, ter dados anexados a ele. Como os arquivos de log geralmente crescem com a adição de novos registros, o Amazon FSx for Lustre atribui uma contagem de faixas padrão de 1 a qualquer arquivo criado no modo de acréscimo, independentemente da configuração de distribuição padrão especificada pelo diretório principal.

A PFL configuração padrão na Amazon FSx para sistemas de arquivos Lustre criados após 25 de agosto de 2023 é definida com este comando:

lfs setstripe -E 100M -c 1 -E 10G -c 8 -E 100G -c 16 -E -1 -c 32 /mountname

Clientes com cargas de trabalho que têm acesso altamente simultâneo a arquivos médios e grandes provavelmente se beneficiarão de um layout com mais faixas em tamanhos menores e distribuídas em todos os arquivos maiores, conforme mostrado no OSTs exemplo de layout de quatro componentes.

Monitoramento da performance e do uso

A cada minuto, o Amazon FSx for Lustre emite métricas de uso de cada disco (MDTeOST) para a Amazon. CloudWatch

Para visualizar detalhes agregados de uso do sistema de arquivos, é possível consultar a estatística Sum de cada métrica. Por exemplo, a soma da DataReadBytes estatística relata a taxa de transferência total de leitura vista por todos OSTs em um sistema de arquivos. De forma semelhante, a estatística Sum de FreeDataStorageCapacity relata a capacidade total de armazenamento disponível para dados de arquivos no sistema de arquivos.

Para obter mais informações sobre como monitorar a performance do sistema de arquivos, consulte Como monitorar o Amazon FSx for Lustre.

Dicas de performance

Ao usar o Amazon FSx for Lustre, lembre-se das seguintes dicas de desempenho. Para saber sobre limites de serviço, consulte Cotas para o Amazon FSx for Lustre.

  • Tamanho médio de E/S — Como o Amazon FSx for Lustre é um sistema de arquivos de rede, cada operação de arquivo passa por uma viagem de ida e volta entre o cliente e o Amazon FSx for Lustre, incorrendo em uma pequena sobrecarga de latência. Por causa dessa latência por operação, o throughput geral normalmente aumenta à medida que o tamanho de E/S cresce, porque a sobrecarga é amortizada em uma quantidade de dados maior.

  • Modelo de solicitação — Ao permitir gravações assíncronas em seu sistema de arquivos, as operações de gravação pendentes são armazenadas em buffer na instância da Amazon antes de serem gravadas no EC2 Amazon for Lustre de forma assíncronaFSx. Normalmente, gravações assíncronas têm latências mais baixas. Ao executar gravações assíncronas, o kernel usa memória adicional para armazenamento em cache. Um sistema de arquivos que permite gravações síncronas emite solicitações síncronas FSx para o Amazon for Lustre. Cada operação passa por uma viagem de ida e volta entre o cliente e a Amazon FSx for Lustre.

    nota

    O modelo de solicitação escolhido tem vantagens e desvantagens em consistência (se você estiver usando várias EC2 instâncias da Amazon) e velocidade.

  • Limitar o tamanho do diretório — Para obter o desempenho ideal de metadados no Persistent_2 FSx para sistemas de arquivos Lustre, limite cada diretório a menos de 100 mil arquivos. Limitar o número de arquivos em um diretório reduz o tempo necessário para que o sistema de arquivos adquira um bloqueio no diretório principal.

  • EC2Instâncias da Amazon — Aplicativos que realizam um grande número de operações de leitura e gravação provavelmente precisam de mais memória ou capacidade de computação do que aplicativos que não o fazem. Ao iniciar suas EC2 instâncias da Amazon para sua carga de trabalho de computação intensiva, escolha tipos de instância que tenham a quantidade desses recursos que seu aplicativo precisa. As características de desempenho dos sistemas de arquivos Amazon FSx for Lustre não dependem do uso de instâncias EBS otimizadas da Amazon.

  • Ajuste recomendado da instância do cliente para um desempenho ideal

    1. Para todos os tipos e tamanhos de instâncias do cliente, recomendamos aplicar o seguinte ajuste:

      sudo lctl set_param osc.*.max_dirty_mb=64
    2. Para tipos de instâncias de clientes com memória superior a 64 GiB, recomendamos aplicar o seguinte ajuste:

      sudo lctl set_param ldlm.namespaces.*.lru_max_age=600000 sudo lctl set_param ldlm.namespaces.*.lru_size=<100 * number_of_CPUs>
    3. Para tipos de instância de cliente com mais de 64 CPU núcleos v, recomendamos aplicar o seguinte ajuste:

      echo "options ptlrpc ptlrpcd_per_cpt_max=32" >> /etc/modprobe.d/modprobe.conf echo "options ksocklnd credits=2560" >> /etc/modprobe.d/modprobe.conf # reload all kernel modules to apply the above two settings sudo reboot

      Após a montagem do cliente, o seguinte ajuste precisa ser aplicado:

      sudo lctl set_param osc.*OST*.max_rpcs_in_flight=32 sudo lctl set_param mdc.*.max_rpcs_in_flight=64 sudo lctl set_param mdc.*.max_mod_rpcs_in_flight=50

    Observe que lctl set_param é conhecido por não persistir durante a reinicialização. Como esses parâmetros não podem ser definidos de forma permanente do lado do cliente, é recomendável implementar tarefas do Cron de inicialização para definir a configuração com os ajustes recomendados.

  • Equilíbrio entre cargas de trabalho OSTs — Em alguns casos, sua carga de trabalho não está gerando a taxa de transferência agregada que seu sistema de arquivos pode fornecer (200 MB/s por TiB de armazenamento). Nesse caso, você pode usar CloudWatch métricas para solucionar problemas se o desempenho for afetado por um desequilíbrio nos padrões de E/S da sua carga de trabalho. Para identificar se essa é a causa, consulte a CloudWatch métrica Máximo do Amazon FSx for Lustre.

    Em alguns casos, essa estatística mostra uma carga igual ou superior a 240 MBps de throughput (a capacidade de throughput de um único disco Amazon for Lustre de 1,2 TiB). FSx Nesses casos, a workload não está distribuída uniformemente pelos discos. Se for esse o caso, você poderá usar o comando lfs setstripe para modificar a distribuição dos arquivos que a workload acessa com mais frequência. Para um desempenho ideal, distribua arquivos com requisitos de alta taxa de transferência em todo o OSTs sistema de arquivos.

    Se seus arquivos forem importados de um repositório de dados, você pode adotar outra abordagem para distribuir seus arquivos de alto rendimento uniformemente em todo o seu. OSTs Para fazer isso, você pode modificar o ImportedFileChunkSize parâmetro ao criar seu próximo sistema de arquivos Amazon FSx for Lustre.

    Por exemplo, suponha que sua carga de trabalho use um sistema de arquivos de 7,0 TiB (que é composto por 6x 1,17 TiBOSTs) e precise gerar alta taxa de transferência em arquivos de 2,4 GiB. Nesse caso, você pode definir o ImportedFileChunkSize valor para (2.4 GiB / 6 OSTs) = 400 MiB que seus arquivos sejam distribuídos uniformemente pelo sistema de arquivosOSTs.

  • Cliente Lustre para metadados IOPS — Se seu sistema de arquivos tiver uma configuração de metadados especificada, recomendamos que você instale um cliente Lustre 2.15 ou um cliente Lustre 2.12 com uma das seguintes versões do sistema operacional: Amazon Linux 2023, Amazon Linux 2, Red Hat/CentOS/Rocky Linux 8.9 ou 9.x, Ubuntu 22 com kernel 6.2 ou Ubuntu 20.