Considerações sobre o SAS noAWS - AWSOrientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Considerações sobre o SAS noAWS

Fundo SAS

  • Espaço de arquivo de dados permanente SAS (SASDATA)

    • Armazena dados persistentes para exploração SAS e arquivos de saída SAS resultantes

    • Lido extensivamente, mas menos extensivamente escrito de volta

  • Espaço de arquivo de dados de trabalho SAS (SASWORK)

    • Espaço de trabalho de rascunho para trabalhos SAS

    • Usado para executar a atividade de armazenamento de trabalho de procedimentos SAS de thread único

  • Espaço de arquivo de dados do utilitário SAS (UTILLOC)

    • O mesmo tipo de espaço que o SASWORK para procedimentos SAS multi-thread

    • Por padrão, colocado como um subdiretório em SASWORK

  • O armazenamento não persiste por meio de uma reinicialização ou reinicialização de dispositivos de estado sólido interno (SSD) distribuídos juntos em uma configuração RAID 0. Recomendamos que você use instâncias com dispositivos efêmeros não-voláteis de memória expressa (NVMe) com alta largura de banda, baixa latência e E/S sequencial. Essas instâncias são ideais para dados SAS temporários (SASWORK e UTILLOC).

Sistema de arquivos compartilhados SAS (necessário para o SAS Grid)

  • AWSconfigura sistemas de arquivos Lustre com orw,seclabel, elazystatfsOpções de montagem. Essas não são as opções de montagem recomendadas para o SAS Grid, então você terá que desmontar esses sistemas de arquivos FSx for Lustre e remontá-los com oflockparâmetro .

  • Você não pode expandir o tamanho do sistema de arquivos Lustre. Para redimensionar, crie um sistema de arquivos Lustre maior e copie dados do sistema antigo para o novo.

  • Para sistemas de arquivos persistentes FSx for Lustre, os dados são replicados em uma única zona de disponibilidade para maior durabilidade. Ele não é replicado emAWSZonas de disponibilidade.

  • Recomendamos que você use a opção de armazenamento do Amazon S3 para uso com o SAS Grid e o FSx for Lustre. Para obter mais informações, consulteUsando repositórios de dados com FSx for LustrenoAWSdocumentação.

  • Consulte oAWSTabela de regiõespara disponibilidade de serviços emAWSRegiões e zonas de disponibilidade. Analise tambémReplicação de mesma região do Amazon S3 (SRR) ou replicação entre regiões (CRR)para implicações das necessidades de replicação de dados para alta disponibilidade.

Tipos de instância da camada de servidor SAS Grid

Os servidores SAS Grid precisam de CPUs rápidas para processar dados. Recomendamos:

  • Um mínimo de 8 GB de RAM física por núcleo físico e taxa de transferência de E/S robusta (especialmente para SASWORK e SAS UTILLOC).

  • Instâncias I3— as instâncias do Amazon EC2 I3 são otimizadas para armazenamento para cargas de trabalho de alta transação e baixa latência. Essas instâncias incluem instâncias baseadas no SSD NVMe otimizadas para armazenamento para alto desempenho de E/S aleatório, alta taxa de transferência de leitura sequencial e IOPS altas. Devido à alta largura de banda interna de E/S de unidades SSD NVMe distribuídas para SASWORK e SAS UTILLOC, você deve configurar seu ambiente para usar explicitamente as unidades locais SSD baseadas em NVME em vez dos volumes do Amazon EBS.

  • Instâncias I3en— Esta família fornece instâncias SSD NVMe otimizadas para armazenamento no Amazon EC2 com rede aprimorada via ENA para atingir até 100 Gbps de largura de banda de rede.

  • Instâncias M5n— A família M5 fornece um equilíbrio de computação, memória e rede. As instâncias M5n são ideais para aplicativos que exigem melhor taxa de transferência de rede e desempenho da taxa de pacotes.

  • As cargas de trabalho SAS podem ser caracterizadas como solicitações de E/S sequenciais predominantemente grandes com grandes volumes de dados. Recomendamos que você predetermine seus padrões de uso do SAS. Isso orientará a arquitetura e a configuração ideais dos sistemas de arquivos subjacentes individuais e seu respectivo provisionamento físico de E/S.

    • Trabalhos estatísticos de consulta, relatórios e leves geralmente funcionam bem com uma taxa de E/S de 100 MiB por segundo por núcleo físico da CPU.

    • Análise avançada e trabalhos estatísticos pesados podem exigir até 150 MiB por segundo por núcleo físico da CPU.

    • No geral, recomendamos uma taxa mínima de throughput de E/S de 100-125 MiB por segundo por núcleo físico da CPU.

Tipos de instância da camada intermediária e do servidor de metadados SAS Grid

Esses servidores não exigem recursos intensivos em computação ou taxa de transferência de E/S robusta. Eles exigem acesso a mais memória do que os níveis de computação SAS. Recomendamos:

  • Um mínimo de 24 GB de RAM física ou 8 GB de RAM física por núcleo físico, o que for maior.

  • Instâncias R5 ou R5d— Essas instâncias são adequadas para aplicativos com uso intensivo de memória, como caches na memória, bancos de dados de médio porte na memória e análise de big data em tempo real.

Alta disponibilidade e recuperação de desastres para o SAS Grid

O planejamento de recuperação de desastres é importante para qualquer sistema de negócios crítico, incluindo sistemas de produção que estejam executando as soluções SAS Intelligence Platform e SAS.

A recuperação de desastres não é a mesma que a alta disponibilidade. Embora ambos os conceitos estejam relacionados à continuidade dos negócios, a alta disponibilidade é fornecer continuidade ininterrupta das operações. Em contraste, a recuperação de desastres envolve algum tempo de inatividade, normalmente medido em horas ou dias.