Gerenciando o armazenamento no FSx for Windows File Server - Amazon FSx for Windows File Server

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Gerenciando o armazenamento no FSx for Windows File Server

A configuração de armazenamento do seu sistema de arquivos inclui a quantidade de capacidade de armazenamento provisionada, o tipo de armazenamento e, se o tipo de armazenamento for uma unidade de estado sólido (SSD), a quantidade de IOPS do SSD. Você pode configurar esses recursos, junto com a capacidade de taxa de transferência do sistema de arquivos, ao criar um sistema de arquivos e depois de criado, para alcançar o desempenho desejado para sua carga de trabalho. Aprenda a gerenciar o armazenamento do seu sistema de arquivos e o desempenho relacionado ao armazenamento usando a AWS Management Console, AWS CLI, e a CLI do Amazon FSx para gerenciamento remoto explorando os tópicos a seguir. PowerShell

Otimizar custos do armazenamento

Você pode otimizar seus custos de armazenamento usando as opções de configuração de armazenamento disponíveis no FSx for Windows.

Opções de tipo de armazenamento — o FSx for Windows File Server fornece dois tipos de armazenamento, unidades de disco rígido (HDD) e unidades de estado sólido (SSD) — para permitir que você otimize o custo/desempenho para atender às suas necessidades de carga de trabalho. O armazenamento em HDD foi projetado para um amplo espectro de workloads, incluindo diretórios pessoais, compartilhamentos de usuários e departamentos e sistemas de gerenciamento de conteúdo. O armazenamento SSD foi projetado para as workloads de mais alta performance e mais sensíveis à latência, incluindo bancos de dados, workloads de processamento de mídia e aplicações de análise de dados. Para obter mais informações sobre tipos de armazenamento e desempenho do sistema de arquivos, consultePerformance do FSx para Windows File Server.

Desduplicação de dados — grandes conjuntos de dados geralmente têm dados redundantes, o que aumenta os custos de armazenamento de dados. Por exemplo, os compartilhamentos de arquivos do usuário podem ter várias cópias do mesmo arquivo, armazenadas por vários usuários. Os compartilhamentos de desenvolvimento de software podem conter muitos binários que permanecem inalterados de uma compilação para outra. Você pode reduzir seus custos de armazenamento de dados ativando a eliminação de duplicação dos dados no sistema de arquivos. Quando ativada, a eliminação de duplicação dos dados reduz ou elimina automaticamente os dados redundantes, armazenando as partes duplicadas do conjunto de dados apenas uma vez. Para obter mais informações sobre a eliminação de duplicação dos dados e como ativá-la facilmente em seu sistema de arquivos do Amazon FSx, consulte Reduzindo os custos de armazenamento com a desduplicação de dados.

Como gerenciar a capacidade de armazenamento

Você pode aumentar a capacidade de armazenamento do sistema de arquivos FSx for Windows à medida que seus requisitos de armazenamento mudarem. Para fazê-lo, você pode usar o console do Amazon FSx, a API do Amazon FSx ou a AWS Command Line Interface (AWS CLI). Os fatores a serem considerados ao planejar um aumento na capacidade de armazenamento incluem saber quando você precisa aumentar a capacidade de armazenamento, entender como o Amazon FSx processa os aumentos de capacidade de armazenamento e acompanhar o progresso de uma solicitação de aumento de armazenamento. Você só pode aumentar a capacidade de armazenamento de um sistema de arquivos; não pode diminuir a capacidade de armazenamento.

nota

Você não pode aumentar a capacidade de armazenamento de sistemas de arquivos criados antes de 23 de junho de 2019 ou de sistemas de arquivos restaurados com base em um backup pertencente a um sistema de arquivos criado antes de 23 de junho de 2019.

Quando você aumenta a capacidade de armazenamento de um sistema de arquivos do Amazon FSx, o Amazon FSx adiciona automaticamente um conjunto de discos novo e maior ao sistema de arquivos. Em seguida, o Amazon FSx executa um processo de otimização de armazenamento em segundo plano para migrar de forma transparente os dados dos discos antigos para os novos discos. A otimização do armazenamento pode levar de algumas horas a alguns dias, com um impacto mínimo perceptível na performance da workload. Durante essa otimização, o uso do backup é temporariamente maior, porque os volumes de armazenamento antigos e novos estão incluídos nos backups no nível de sistema de arquivos. Ambos os conjuntos de volumes de armazenamento são incluídos para garantir que o Amazon FSx possa obter e restaurar backups com êxito, mesmo durante a atividade de escalabilidade de armazenamento. O uso do backup faz a reversão ao nível básico anterior depois que os volumes de armazenamento antigos não estão mais incluídos no histórico de backup. Quando a nova capacidade de armazenamento estiver disponível, você será cobrado somente pela nova capacidade de armazenamento.

A ilustração a seguir mostra as quatro etapas principais do processo que o Amazon FSx usa quando aumenta a capacidade de armazenamento de um sistema de arquivos.

Diagrama mostrando as quatro etapas: 1. Solicitação de aumento da capacidade de armazenamento, 2. O FSx adiciona novos discos maiores, 3. O FSx migra dados e 4. O FSx remove discos antigos.

Você pode acompanhar o andamento da otimização do armazenamento, dos aumentos da capacidade de armazenamento SSD ou das atualizações do IOPS SSD a qualquer momento usando o console do Amazon FSx, a CLI ou a API. Para ter mais informações, consulte Como monitorar os aumentos da capacidade de armazenamento.

O que saber sobre o aumento da capacidade de armazenamento de um sistema de arquivos

Aqui estão alguns itens importantes a serem considerados ao aumentar a capacidade de armazenamento:

  • Apenas aumentar: você só pode aumentar a capacidade de armazenamento de um sistema de arquivos, não pode diminuí-la.

  • Aumento mínimo: cada aumento na capacidade de armazenamento deve ser, no mínimo, de 10% da capacidade de armazenamento atual do sistema de arquivos, até o valor máximo permitido de 65.536 GiB.

  • Capacidade de throughput mínima: para aumentar a capacidade de armazenamento, o sistema de arquivos deve ter uma capacidade de throughput mínima de 16 MB/s. Isso ocorre porque a etapa de otimização do armazenamento é um processo que exige throughput elevado.

  • Tempo entre os aumentos: não é possível fazer mais aumentos de capacidade de armazenamento em um sistema de arquivos até seis horas após a solicitação do último aumento ou até que o processo de otimização de armazenamento seja concluído, o que for mais longo. A otimização do armazenamento pode levar de algumas horas a alguns dias para ser concluída. Para minimizar o tempo necessário para a conclusão da otimização do armazenamento, recomendamos o aumento da capacidade de throughput do sistema de arquivos antes do aumento da capacidade de armazenamento (a capacidade de throughput pode ser reduzida novamente após a conclusão da escalabilidade do armazenamento) e o aumento da capacidade de armazenamento quando houver tráfego mínimo no sistema de arquivos.

nota

Certos eventos do sistema de arquivos podem consumir recursos de performance de E/S de disco. Por exemplo:

A fase de otimização da escalabilidade da capacidade de armazenamento pode gerar maior throughput de disco e causar avisos de performance. Para ter mais informações, consulte Avisos e recomendações de performance.

Saber quando aumentar a capacidade de armazenamento

Aumente a capacidade de armazenamento do sistema de arquivos quando ele estiver com pouca capacidade de armazenamento livre. Use a FreeStorageCapacity CloudWatch métrica para monitorar a quantidade de armazenamento gratuito disponível no sistema de arquivos. Você pode criar um CloudWatch alarme da Amazon sobre essa métrica e ser notificado quando ela cair abaixo de um limite específico. Para ter mais informações, consulte Monitoramento com a Amazon CloudWatch.

Recomendamos manter pelo menos 10% da capacidade de armazenamento livre em todos os momentos em seu sistema de arquivos. O uso de toda a capacidade de armazenamento pode afetar negativamente a performance e introduzir inconsistências de dados.

Você poderá aumentar automaticamente a capacidade de armazenamento do sistema de arquivos quando a capacidade de armazenamento livre cair abaixo de um limite definido que você especificar. Use o AWS AWS CloudFormation modelo personalizado desenvolvido para implantar todos os componentes necessários para implementar a solução automatizada. Para ter mais informações, consulte Como aumentar a capacidade de armazenamento de forma dinâmica.

Aumentos da capacidade de armazenamento e performance do sistema de arquivos

A maioria das workloads sofre um impacto mínimo na performance enquanto o Amazon FSx executa o processo de otimização de armazenamento em segundo plano após a disponibilidade da nova capacidade de armazenamento. Aplicações com uso pesado de gravação e grandes conjuntos de dados ativos podem temporariamente sofrer uma redução de até a metade na performance de gravação. Nesses casos, você pode primeiro aumentar a capacidade de throughput do sistema de arquivos antes de aumentar a capacidade de armazenamento. Isso permite que você continue a fornecer o mesmo nível de throughput para atender às necessidades de performance da aplicação. Para ter mais informações, consulte Gerenciando a capacidade de taxa de transferência em sistemas de arquivos FSx for Windows File Server.

Gerenciando o tipo de armazenamento do sistema de arquivos FSx for Windows

Você pode alterar o tipo de armazenamento do sistema de arquivos de HDD para SSD usando o e. AWS Management Console AWS CLI Ao alterar o tipo de armazenamento para SSD, lembre-se de que não é possível atualizar a configuração do sistema de arquivos novamente até 6 horas após a solicitação da última atualização ou até que o processo de otimização do armazenamento seja concluído, o que for maior. A otimização do armazenamento pode levar de algumas horas a alguns dias para ser concluída. Para minimizar esse tempo, recomendamos atualizar o tipo de armazenamento quando houver tráfego mínimo no sistema de arquivos. Para ter mais informações, consulte Atualizando o tipo de armazenamento de um sistema de arquivos FSx for Windows.

Você não pode alterar o tipo de armazenamento do sistema de arquivos de SSD para HDD. Se você quiser alterar o tipo de armazenamento de um sistema de arquivos de HDD para SSD, precisará restaurar um backup do sistema de arquivos em um novo sistema de arquivos configurado para usar o armazenamento em HDD. Para ter mais informações, consulte Restaurando backups em um novo sistema de arquivos.

Sobre os tipos de armazenamento

Você pode configurar seu sistema de arquivos FSx for Windows File Server para usar o tipo de armazenamento da unidade de estado sólido (SSD) ou da unidade de disco rígido magnético (HDD).

O armazenamento SSD é apropriado para a maioria das workloads de produção que têm requisitos de alta performance e sensibilidade à latência. Exemplos dessas cargas de trabalho incluem bancos de dados, análise de dados, processamento de mídia e aplicativos de negócios. Também recomendamos o SSD para casos de uso que envolvam um grande número de usuários finais, altos níveis de E/S ou conjuntos de dados que tenham um grande número de arquivos pequenos. Por fim, recomendamos o uso de armazenamento SSD se você planeja habilitar cópias de sombra. Você pode configurar e escalar IOPS de SSD para sistemas de arquivos com armazenamento SSD, mas não armazenamento em HDD.

O armazenamento em HDD foi projetado para uma ampla variedade de cargas de trabalho, incluindo diretórios pessoais, compartilhamentos de arquivos de usuários e departamentos e sistemas de gerenciamento de conteúdo. O armazenamento em HDD tem um custo menor em relação ao armazenamento SSD, mas com latências mais altas e níveis mais baixos de taxa de throughput e IOPS de disco por unidade de armazenamento. Ele pode ser adequado para compartilhamentos de usuários de uso geral e diretórios de base com baixos requisitos de E/S, grandes sistemas de gerenciamento de conteúdo (CMS) em que os dados são recuperados com pouca frequência ou conjuntos de dados com pequenos números de arquivos grandes.

Para ter mais informações, consulte Configuração e performance do armazenamento.

Como gerenciar IOPS de SSD

Para sistemas de arquivos configurados com armazenamento SSD, a quantidade de IOPS SSD determina a quantidade de E/S de disco disponível quando seu sistema de arquivos precisa ler e gravar dados no disco, em oposição aos dados que estão em cache. Você pode selecionar e escalar a quantidade de IOPS SSD independentemente da capacidade de armazenamento. O máximo de IOPS de SSD que você pode provisionar depende da capacidade de armazenamento e da capacidade de throughput que você seleciona para o sistema de arquivos. Se você tentar aumentar seu SSD IOPS acima do limite suportado por sua capacidade de taxa de transferência, talvez seja necessário aumentar sua capacidade de taxa de transferência para obter esse nível de IOPS de SSD. Para obter mais informações, consulte Performance do FSx para Windows File Server e Gerenciando a capacidade de taxa de transferência em sistemas de arquivos FSx for Windows File Server.

Aqui estão alguns itens importantes que você deve saber sobre a atualização das IOPS SSD provisionadas de um sistema de arquivos:

  • Escolhendo um modo de IOPS — há dois modos de IOPS para escolher:

    • Automático — escolha esse modo e o Amazon FSx escalará automaticamente seu SSD IOPS para manter 3 SSD IOPS por GiB de capacidade de armazenamento, até 400.000 SSD IOPS por sistema de arquivos.

    • Provisionado pelo usuário — escolha esse modo para que você possa especificar o número de SSD IOPS no intervalo de 96 a 400.000. Especifique um número entre 3 e 50 IOPS por GiB de capacidade de armazenamento para todos onde o Regiões da AWS Amazon FSx está disponível, ou entre 3 e 500 IOPS por GiB de capacidade de armazenamento no Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Leste dos EUA (Ohio), Europa (Irlanda), Ásia-Pacífico (Tóquio) e Ásia-Pacífico (Cingapura). Quando você escolhe o modo provisionado pelo usuário e a quantidade de SSD IOPS especificada não é de pelo menos 3 IOPS por GiB, a solicitação falha. Para níveis mais altos de IOPS de SSD provisionada, você paga pela média de IOPS acima de 3 IOPS por GiB por sistema de arquivos.

  • Atualizações da capacidade de armazenamento — Se você aumentar a capacidade de armazenamento do seu sistema de arquivos e a quantidade exigir, por padrão, uma quantidade de SSD IOPS maior do que o nível atual de IOPS de SSD provisionado pelo usuário, o Amazon FSx automaticamente mudará seu sistema de arquivos para o modo Automático e seu sistema de arquivos terá no mínimo 3 SSD IOPS por GiB de capacidade de armazenamento.

  • Atualizações da capacidade de throughput: se você aumentar a capacidade de throughput e a IOPS de SSD compatível com a nova capacidade de throughput for superior ao nível de IOPS de SSD provisionado pelo usuário, o Amazon FSx alternará automaticamente o sistema de arquivos para o modo Automático.

  • A frequência de IOPS de SSD aumenta — você não pode fazer mais aumentos de IOPS de SSD, aumentos na capacidade de taxa de transferência ou atualizações do tipo de armazenamento em um sistema de arquivos até 6 horas após a solicitação do último aumento ou até que o processo de otimização do armazenamento seja concluído, o que for maior. A otimização do armazenamento pode levar de algumas horas a alguns dias para ser concluída. Para minimizar o tempo necessário para a conclusão da otimização do armazenamento, recomendamos escalar a IOPS de SSD quando houver tráfego mínimo no sistema de arquivos.

nota

Observe que níveis de capacidade de taxa de transferência de 4.608 MBps ou mais são suportados somente no seguinte Regiões da AWS: Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Leste dos EUA (Ohio), Europa (Irlanda), Ásia-Pacífico (Tóquio) e Ásia-Pacífico (Cingapura).

Para obter mais informações sobre como atualizar a quantidade de IOPS SSD provisionadas para seu sistema de arquivos FSx for Windows File Server, consulte. Atualizando o IOPS SSD de um sistema de arquivos

Reduzindo os custos de armazenamento com a desduplicação de dados

A desduplicação de dados, geralmente chamada abreviadamente de Dedup, ajuda os administradores de armazenamento a reduzir os custos associados aos dados duplicados. Com o FSx for Windows File Server, você pode usar o Microsoft Data Deduplication para identificar e eliminar dados redundantes. Grandes conjuntos de dados geralmente têm dados redundantes, o que aumenta os custos de armazenamento de dados. Por exemplo: .

  • Os compartilhamentos de arquivos do usuário podem ter várias cópias dos mesmos arquivos ou de arquivos semelhantes.

  • Os compartilhamentos de desenvolvimento de software podem ter muitos binários que permanecem inalterados de uma compilação para outra.

Você pode reduzir seus custos de armazenamento de dados habilitando a desduplicação de dados em seu sistema de arquivos. A eliminação de duplicação de dados reduz ou elimina dados redundantes ao armazenar partes duplicadas do conjunto de dados somente uma vez. Quando você ativa a desduplicação de dados, a compactação de dados é ativada por padrão, comprimindo os dados após a desduplicação para economizar ainda mais. A desduplicação de dados otimiza as redundâncias sem comprometer a fidelidade ou a integridade dos dados. A eliminação de duplicação de dados é executada como um processo em segundo plano que verifica e otimiza seu sistema de arquivos de forma contínua e automática, além de ser transparente para seus usuários e clientes conectados.

A economia de armazenamento que você pode obter com a eliminação de duplicação de dados depende da natureza do seu conjunto de dados, incluindo a quantidade de duplicação existente nos arquivos. A economia típica é em média de 50 a 60% para compartilhamentos de arquivos de uso geral. Em compartilhamentos, as economias variam de 30 a 50% para documentos do usuário a 70 a 80% para conjuntos de dados de desenvolvimento de software. Você pode medir a economia potencial de desduplicação usando o PowerShell comando Measure-FSxDedupFileMetadata remoto descrito abaixo.

Você também pode personalizar a eliminação de duplicação de dados para atender às suas necessidades específicas de armazenamento. Por exemplo, você pode configurar a eliminação de duplicação para ser executada somente em determinados tipos de arquivo ou criar uma programação de trabalho personalizada. Como as tarefas de eliminação de duplicação podem consumir recursos do servidor de arquivos, recomendamos monitorar o status das tarefas de eliminação de duplicação usando o comando Get-FSxDedupStatus descrito abaixo.

Para obter mais informações sobre a eliminação de duplicação de dados, consulte a documentação da Microsoft Noções básicas da eliminação de duplicação de dados.

nota

Consulte nossas práticas recomendadas para Melhores práticas ao usar a desduplicação de dados. Se você encontrar problemas com a execução bem-sucedida dos trabalhos de eliminação de duplicação de dados, consulte Solução de problemas da eliminação de duplicação dos dados.

Atenção

Não é recomendável executar determinados comandos do Robocopy com eliminação de duplicação de dados, pois esses comandos podem afetar a integridade dos dados do armazenamento em blocos. Para obter mais informações, consulte a documentação Data Deduplication Interoperability da Microsoft.

Melhores práticas ao usar a desduplicação de dados

Veja a seguir algumas práticas recomendadas para usar a eliminação de duplicação de dados:

  • Programar trabalhos de eliminação de duplicação de dados para serem executados quando o sistema de arquivos estiver inativo: a programação padrão inclui um trabalho GarbageCollection semanal às 2h45 UTC, aos sábados. Pode levar várias horas para ser concluído, se você tiver uma grande quantidade de rotatividade de dados em seu sistema de arquivos. Se esse horário não for ideal para sua workload, agende essa tarefa para ser executada em um momento em que você espera pouco tráfego em seu sistema de arquivos.

  • Configurar capacidade de throughput suficiente para que a eliminação de duplicação de dados seja concluída: capacidades de throughput mais altas fornecem níveis mais altos de memória. A Microsoft recomenda ter 1 GB de memória por 1 TB de dados lógicos para executar a eliminação de duplicação de dados. Use a tabela de performance do Amazon FSx para determinar a memória associada à capacidade de throughput do seu sistema de arquivos e garantir que os recursos de memória sejam suficientes para o tamanho dos seus dados.

  • Personalizar as configurações de eliminação de duplicação de dados para atender às suas necessidades específicas de armazenamento e reduzir os requisitos de performance: você pode restringir a otimização para execução em tipos de arquivos ou pastas específicos ou definir um tamanho mínimo de arquivo e uma idade para otimização. Para saber mais, consulte Reduzindo os custos de armazenamento com a desduplicação de dados.

Como gerenciar a eliminação de duplicação de dados

Você pode gerenciar a desduplicação de dados em seu sistema de arquivos usando a CLI do Amazon FSx para gerenciamento remoto ativado. PowerShell Para obter mais informações sobre o uso do gerenciamento remoto CLI do Amazon FSx em, consulte. PowerShell Usando a CLI do Amazon FSx para PowerShell

A seguir estão os comandos que você pode usar para eliminação de duplicação de dados.

Comando de eliminação de duplicação de dados Descrição

Enable-FSxDedup

Permite a eliminação de duplicação de dados no compartilhamento de arquivos. A compactação de dados, após a eliminação de duplicação de dados, é habilitada por padrão quando você habilita a eliminação de duplicação de dados.

Disable-FSxDedup

Desativa a eliminação de duplicação de dados no compartilhamento de arquivos.

Get-FSxDedupConfiguration

Recupera informações de configuração de eliminação de duplicação de dados, incluindo tamanho mínimo do arquivo e idade para otimização, configurações de compactação e tipos de arquivos e pastas excluídos.

Set-FSxDedupConfiguration

Altera as configurações de eliminação de duplicação, incluindo tamanho e idade mínimos do arquivo para otimização, configurações de compactação e tipos de arquivos e pastas excluídos.

Get-FSxDedupStatus

Recupere o status da desduplicação e inclua propriedades somente para leitura que descrevam a economia e o status da otimização no sistema de arquivos, os horários e o status de conclusão dos últimos trabalhos de desduplicação no sistema de arquivos.

Get-FSxDedupMetadata

Recupera metadados de otimização de eliminação de duplicação.

Update-FSxDedupStatus

Calcula e recupera informações atualizadas sobre economia de eliminação de duplicação de dados.

Measure-FSxDedupFileMetadata

Mede e recupera o espaço de armazenamento potencial que você pode recuperar em seu sistema de arquivos, se excluir um grupo de pastas. Os arquivos geralmente têm partes que são compartilhadas em outras pastas, e o mecanismo de eliminação de duplicação calcula quais partes são exclusivas e que seriam excluídas.

Get-FSxDedupSchedule

Recupera as programações de eliminação de duplicação que estão definidas atualmente.

New-FSxDedupSchedule

Crie e personalize um cronograma de desduplicação de dados.

Set-FSxDedupSchedule

Altere as configurações dos cronogramas de desduplicação de dados existentes.

Remove-FSxDedupSchedule

Exclua um cronograma de desduplicação.

Get-FSxDedupJob

Obtenha o status e as informações de todos os trabalhos de desduplicação atualmente em execução ou em fila.

Stop-FSxDedupJob

Cancele um ou mais trabalhos de eliminação de duplicação de dados especificados.

A ajuda on-line de cada comando fornece uma referência de todas as opções de comando. Para acessar essa ajuda, execute o comando com -?, por exemplo Enable-FSxDedup -?.

Como habilitar a eliminação de duplicação de dados

Você habilita a eliminação de duplicação de dados em um compartilhamento de arquivos do Amazon FSx para Windows File Server usando o comando Enable-FSxDedup, conforme a seguir.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Enable-FsxDedup }

Quando você habilita a eliminação de duplicação de dados, uma programação e uma configuração padrão são criadas. Você pode criar, modificar e remover programações e configurações usando os comandos abaixo.

Você pode usar o comando Disable-FSxDedup para desativar totalmente a eliminação de duplicação de dados em seu sistema de arquivos.

Como criar uma programação de eliminação de duplicação de dados

Embora a programação padrão funcione bem na maioria dos casos, você pode criar um nova programação de eliminação de duplicação usando o comando New-FsxDedupSchedule, mostrado a seguir. As programações de eliminação de duplicação de dados usam o horário UTC.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock { New-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Wed,Sat -Start 08:00 -DurationHours 7 }

Esse comando cria uma programação chamada CustomOptimization que é executada na segunda, quarta e sábado, iniciando o trabalho às 8h (UTC) todos os dias, com uma duração máxima de sete horas, após as quais o trabalho é interrompido, se ainda estiver em execução.

Observe que a criação de novas programações de trabalho de eliminação de duplicação personalizadas não substitui nem remove a programação padrão existente. Antes de criar um trabalho de eliminação de duplicação personalizado, talvez você queira desativar o trabalho padrão se não precisar dele.

Você pode desativar a programação de eliminação de duplicação padrão usando o comando Set-FsxDedupSchedule, mostrado a seguir.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Set-FSxDedupSchedule -Name “BackgroundOptimization” -Enabled $false}

Você pode remover uma programação de eliminação de duplicação usando o comando Remove-FSxDedupSchedule -Name "ScheduleName". Observe que a programação padrão de eliminação de duplicação BackgroundOptimization não pode ser modificada ou removida e, em vez disso, precisará ser desabilitada.

Como modificar uma programação de eliminação de duplicação de dados

Você pode modificar uma programação de eliminação de duplicação existente usando o comando Set-FsxDedupSchedule, mostrado a seguir.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Tues,Wed,Sat -Start 09:00 -DurationHours 9 }

Esse comando modifica a programação CustomOptimization existente para ser executada de segunda a quarta e sábado, iniciando a tarefa às 9h (UTC) todos os dias, com uma duração máxima de nove horas, após a qual a tarefa será interrompida, se ainda estiver em execução.

Para modificar a idade mínima do arquivo antes de otimizar a configuração, use o comando Set-FSxDedupConfiguration.

Como visualizar a quantidade de espaço economizado

Para visualizar a quantidade de espaço em disco que você está economizando ao executar a eliminação de duplicação de dados, use o comando Get-FSxDedupStatus como a seguir.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FsxRemoteAdmin -ScriptBlock { Get-FSxDedupStatus } | select OptimizedFilesCount,OptimizedFilesSize,SavedSpace,OptimizedFilesSavingsRate OptimizedFilesCount OptimizedFilesSize SavedSpace OptimizedFilesSavingsRate ------------------- ------------------ ---------- ------------------------- 12587 31163594 25944826 83
nota

Os valores mostrados na resposta do comando para os seguintes parâmetros não são confiáveis e você não deve usar esses valores: Capacidade FreeSpace UsedSpace, UnoptimizedSize,, SavingsRate e.

Solução de problemas da eliminação de duplicação dos dados

Há várias causas possíveis para problemas de eliminação de duplicação dos dados, conforme descrito na seção a seguir.

A eliminação de duplicação dos dados não está funcionando

Para ver o status atual da desduplicação de dados, execute o Get-FSxDedupStatus PowerShell comando para ver o status de conclusão dos trabalhos de desduplicação mais recentes. Se um ou mais trabalhos estiverem falhando, talvez você não veja um aumento na capacidade de armazenamento livre no seu sistema de arquivos.

O motivo mais comum de falha nos trabalhos de eliminação de duplicação é a falta de memória.

  • A Microsoft recomenda, de forma ideal, ter 1 GB de memória por 1 TB de dados lógicos (ou no mínimo 350 MB por 1 TB de dados lógicos). Use a tabela de performance do Amazon FSx para determinar a memória associada à capacidade de throughput do seu sistema de arquivos e garantir que os recursos de memória sejam suficientes para o tamanho dos seus dados. Caso contrário, você precisará aumentar a capacidade de taxa de transferência do sistema de arquivos para o nível que atenda aos requisitos de memória de 1 GB por 1 TB de dados lógicos.

  • Os trabalhos de eliminação de duplicação são configurados com o padrão recomendado pelo Windows de 25% de alocação de memória, o que significa que, para um sistema de arquivos com 32 GB de memória, 8 GB estarão disponíveis para eliminação de duplicação. A alocação de memória é configurável (usando o Set-FSxDedupSchedule comando com parâmetro–Memory). Esteja ciente de que usar uma maior alocação de memória para desduplicação pode afetar o desempenho do sistema de arquivos.

  • Você pode modificar a configuração das tarefas de desduplicação para reduzir a quantidade de memória necessária. Por exemplo, você pode restringir a otimização a ser executada em tipos de arquivos ou pastas específicos ou definir um tamanho e uma idade mínimos para a otimização. Também recomendamos configurar os trabalhos de eliminação de duplicação para serem executados durante períodos ociosos, quando há carga mínima no sistema de arquivos.

Você também poderá visualizar erros se os trabalhos de eliminação de duplicação não tiverem tempo suficiente para serem concluídos. Talvez você precise alterar a duração máxima dos trabalhos, conforme descrito em Como modificar uma programação de eliminação de duplicação de dados.

Se os trabalhos de eliminação de duplicação estiverem falhando por um longo período e houver alterações nos dados do sistema de arquivos durante esse período, os trabalhos de eliminação de duplicação subsequentes poderão exigir mais recursos para serem concluídos com êxito pela primeira vez.

Os valores de eliminação de duplicação são inesperadamente definidos como 0

Os valores para SavedSpace e OptimizedFilesSavingsRate são inesperadamente definidos como 0 para um sistema de arquivos no qual você configurou a eliminação de duplicação dos dados.

Isso pode ocorrer durante o processo de otimização do armazenamento quando você aumenta a capacidade de armazenamento do sistema de arquivos. Quando você aumenta a capacidade de armazenamento de um sistema de arquivos, o Amazon FSx cancela os trabalhos de eliminação de duplicação dos dados existentes durante o processo de otimização do armazenamento, que migra os dados dos discos antigos para os discos novos e maiores. O Amazon FSx retoma a eliminação de duplicação dos dados no sistema de arquivos assim que o trabalho de otimização do armazenamento é concluído. Para obter mais informações sobre o aumento da capacidade de armazenamento e a otimização do armazenamento, consulte Como gerenciar a capacidade de armazenamento.

O espaço não é liberado no sistema de arquivos após a exclusão de arquivos

O comportamento esperado da eliminação de duplicação dos dados é que, se os dados que foram excluídos eram dados para os quais a eliminação de duplicação havia economizado espaço, o espaço não será realmente liberado no sistema de arquivos até que o trabalho de coleta de resíduos seja executado.

Uma prática que pode ser útil é definir uma programação para a execução do trabalho de coleta de resíduos logo após a exclusão de um grande número de arquivos. Após a conclusão do trabalho de coleta de resíduos, você pode definir o cronograma de coleta de resíduos de volta às configurações originais. Isso garante que você possa visualizar rapidamente o espaço resultante de suas exclusões.

Use o procedimento a seguir para definir o trabalho de coleta de resíduos para ser executado em 5 minutos.

  1. Para verificar se a eliminação de duplicação dos dados está habilitada, use o comando Get-FSxDedupStatus. Para obter mais informações sobre o comando e sua saída esperada, consulte Como visualizar a quantidade de espaço economizado.

  2. Use o procedimento a seguir para definir a programação de execução do trabalho de coleta de resíduos para daqui a cinco minutos.

    $FiveMinutesFromNowUTC = ((get-date).AddMinutes(5)).ToUniversalTime() $DayOfWeek = $FiveMinutesFromNowUTC.DayOfWeek $Time = $FiveMinutesFromNowUTC.ToString("HH:mm") Invoke-Command -ComputerName ${RPS_ENDPOINT} -ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "WeeklyGarbageCollection" -Days $Using:DayOfWeek -Start $Using:Time -DurationHours 9 }
  3. Depois que o trabalho de coleta de resíduos tiver sido executado e o espaço tiver sido liberado, defina a programação de volta para suas configurações originais.