Considerações sobre o SAS em AWS - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Considerações sobre o SAS em AWS

Plano de fundo do SAS

  • Espaço de Arquivo de Dados Permanente do SAS (SASDATA)

    • Armazena dados persistentes para a exploração do SAS e arquivos de saída SAS resultantes

    • Extensivamente lido, mas menos extensivamente escrito de volta

  • Espaço de Arquivo de Dados de Trabalho do SAS (SASWORK)

    • Espaço de trabalho Scratch para trabalhos do SAS

    • Usado para realizar a atividade de armazenamento funcional de procedimentos SAS de thread único

  • Espaço de Arquivo de Dados do Utilitário SAS (UTILLOC)

    • Mesmo tipo de espaço que o SASWORK para procedimentos SAS de threads múltiplos

    • Por padrão, colocado como um subdiretório em SASWORK

  • O armazenamento não persiste por meio de um reboot ou uma reinicialização de dispositivos internos de estado sólido (SSD) que são agrupados em uma configuração RAID 0. Recomendamos que você use instâncias com dispositivos efêmeros de memória não volátil express (NVMe) com alta largura de banda, baixa latência e E/S sequencial. Essas instâncias são ideais para dados SAS temporários (SASWORK e UTILLOC).

Sistema de arquivos compartilhados SAS (necessário para o SAS Grid)

  • AWS configura os sistemas de arquivos Lustre com as opções de lazystatfs montagem rwseclabel, e. Essas não são as opções de montagem recomendadas para o SAS Grid, portanto, você precisará desmontá-las FSx para sistemas de arquivos Lustre e remontá-las com o parâmetro. flock

  • Você não pode expandir o tamanho do seu sistema de arquivos Lustre. Para redimensionar, crie um sistema de arquivos Lustre maior e copie os dados do sistema antigo para o novo.

  • FSx Para sistemas de arquivos persistentes Lustre, os dados são replicados em uma única zona de disponibilidade para maior durabilidade. Ele não é replicado nas Zonas de Disponibilidade AWS .

  • Recomendamos que você use a opção de armazenamento Amazon S3 para uso com o SAS Grid e FSx para o Lustre. Para obter mais informações, consulte Usando repositórios de dados com o FSx for Lustre na AWS documentação.

  • Consulte a tabela de AWS regiões para ver a disponibilidade dos serviços em todas AWS as regiões e zonas de disponibilidade. Além disso, analise a replicação na mesma região (SRR) ou a replicação entre regiões (CRR) do Amazon S3 para ver as implicações das necessidades de replicação de dados para alta disponibilidade.

Tipos de instância de níveis de servidor SAS Grid

Os servidores SAS Grid precisam de rapidez CPUs para processar dados. Recomendamos:

  • Um mínimo de 8 GB de RAM física por núcleo físico e uma taxa de throughput de E/S robusta (especialmente para SASWORK e SAS UTILLOC).

  • Instâncias I3 — As instâncias EC2 I3 da Amazon são otimizadas para armazenamento para cargas de trabalho de alta transação e baixa latência. Essas instâncias incluem instâncias NVMe baseadas em SSD que são otimizadas para armazenamento para alto desempenho de E/S aleatória, alta taxa de transferência de leitura sequencial e alto IOPS. Devido à alta largura de banda interna de E/S das unidades NVMe SSD distribuídas para SASWORK e SAS UTILLOC, você deve configurar seu ambiente para usar explicitamente as unidades NVMe SSD locais baseadas em vez dos volumes do Amazon EBS.

  • Instâncias I3en — Essa família fornece instâncias NVMe SSD otimizadas para armazenamento na EC2 Amazon com rede aprimorada via ENA para atingir até 100 Gbps de largura de banda de rede.

  • Instâncias M5n — A família M5 oferece um equilíbrio entre computação, memória e rede. As instâncias M5n são ideais para aplicativos que exigem maior taxa de throughput de rede e desempenho da taxa de pacotes.

  • A carga de trabalho do SAS pode ser caracterizada como solicitações de E/S sequenciais predominantemente grandes com grandes volumes de dados. Recomendamos que você predetermine seus padrões de uso do SAS. Isso orientará a arquitetura e a configuração ideais dos sistemas de arquivos subjacentes individuais e seu respectivo provisionamento físico de E/S.

    • As tarefas de consulta, emissão de relatórios e estatísticas leves geralmente funcionam bem com uma taxa de E/S de 100 MiB por segundo por núcleo físico da CPU.

    • Análises avançadas e trabalhos estatísticos pesados podem exigir até 150 MiB por segundo por núcleo físico de CPU.

    • No geral, recomendamos uma taxa de throughput mínima de E/S de 100-125 MiB por segundo por núcleo físico da CPU.

Tipos de instância de nível intermediário e de nível de servidor de metadados do SAS Grid

Esses servidores não exigem recursos de computação intensiva nem uma taxa de throughput de E/S robusta. Eles exigem acesso a mais memória do que os níveis de computação do SAS. Recomendamos:

  • Um mínimo de 24 GB de RAM física ou 8 GB de RAM física por núcleo físico, o que for maior.

  • Instâncias R5 ou R5d — Essas instâncias são adequadas para aplicativos como o uso do cache na memória, como caches na memória de bancos de dados de médio porte e análise de big data em tempo real.

Alta disponibilidade e recuperação de desastres para o SAS Grid

O planejamento da recuperação de desastres é importante para qualquer sistema comercial crítico, incluindo sistemas de produção que estejam executando a SAS Intelligence Platform e as soluções SAS.

Recuperação de desastres não é o mesmo que alta disponibilidade. Embora ambos os conceitos estejam relacionados à continuidade dos negócios, a alta disponibilidade significa fornecer continuidade ininterrupta das operações. Por outro lado, a recuperação de desastres envolve algum tempo de inatividade, normalmente medido em horas ou dias.