Como solucionar problemas do gateway de arquivos - AWSStorage Gateway

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como solucionar problemas do gateway de arquivos

É possível configurar o gateway de arquivos com um grupo de logs do Amazon CloudWatch ao executar o VMware vSphere High Availability (HA). Se fizer isso, você receberá notificações sobre o status de integridade do gateway de arquivos e sobre erros que o gateway de arquivos encontra. É possível encontrar informações sobre essas notificações de erros e de integridade no CloudWatch Logs.

Nas seções a seguir, é possível encontrar informações que podem ajudar a entender a causa de cada erro e notificação de integridade e como corrigir problemas.

: ERROR ObjectMissing

Você pode obter umObjectMissingErro quando um gravador diferente do gateway de arquivos determinado exclui o arquivo especificado do Amazon FSx. Todos os uploads subsequentes no Amazon FSx ou as recuperações do Amazon FSx para o objeto falharão.

Para resolver um erro ObjectMissing
  1. Salve a cópia mais recente do arquivo no sistema de arquivos local do cliente SMB (você precisa dessa cópia de arquivo na etapa 3).

  2. Exclua o arquivo do gateway de arquivos usando o cliente SMB.

  3. Copie a versão mais recente do arquivo que você salvou na etapa 1 do Amazon FSx usando o cliente SMB. Faça isso por meio do gateway de arquivos.

: Notification Reinicializar

É possível obter uma notificação de reinicialização quando a VM do gateway é reiniciada. É possível reiniciar a VM de um gateway usando o console de gerenciamento do VM Hypervisor ou o console do Storage Gateway. Também é possível reiniciar usando o software de gateway durante o ciclo de manutenção do gateway.

Se a hora da reinicialização estiver dentro de 10 minutos da hora de início da manutenção configurada do gateway, essa reinicialização provavelmente será uma ocorrência normal e não um sinal de algum problema. Se a reinicialização ocorreu significativamente fora da janela de manutenção, verifique se o gateway foi reiniciado manualmente.

: Notification HardReboot

Você pode receber uma notificação HardReboot quando a VM do gateway é reiniciada inesperadamente. Essa reinicialização pode ocorrer devido à falta de energia, à uma falha de hardware ou a outro evento. Para gateways do VMware, uma reinicialização pelo Monitoramento de aplicativos do vSphere High Availability pode acionar esse evento.

Quando o gateway for executado nesse ambiente, verifique a presença da notificação HealthCheckFailure e consulte o log de eventos do VMware da VM.

: Notification HealthCheckFailure

Para um gateway no VMware vSphere HA, você pode receber uma notificação HealthCheckFailure quando uma verificação de integridade falha e uma reinicialização da VM é solicitada. Esse evento também ocorre durante um teste para monitorar a disponibilidade, indicado por uma notificação AvailabilityMonitorTest. Nesse caso, a notificação HealthCheckFailure é esperada.

nota

Esta notificação é apenas para gateways do VMware.

Se esse evento ocorrer repetidamente sem uma notificação AvailabilityMonitorTest, verifique se a infraestrutura da VM está com problemas (armazenamento, memória e assim por diante). Se precisar de assistência adicional, entre em contatoAWS Support.

: Notification AvailabilityMonitorTest

Você recebe umAvailabilityMonitorTestnotificação quando vocêexecutar um testedoMonitoramento de disponibilidade e aplicativosSistema em gateways em execução em uma plataforma do VMware vSphere HA.

: ERROR RoleTrustRelationshipInvalid

Você recebe esse erro quando a função do IAM para um compartilhamento de arquivos tem uma relação de confiança do IAM configurada incorretamente (isto é, a função do IAM não confia no principal do Storage Gateway chamadostoragegateway.amazonaws.com). Como resultado, o gateway de arquivos não poderia obter as credenciais para executar nenhuma operação no bucket do S3 que ofereça suporte ao compartilhamento de arquivos.

Para resolver um erro RoleTrustRelationshipInvalid

Solução de problemas com métricas do CloudWatch

Você pode encontrar informações a seguir sobre ações para solucionar problemas no uso de métricas do Amazon CloudWatch com o Storage Gateway.

Seu gateway reage lentamente ao navegar em diretórios

Se o gateway de arquivos reage lentamente ao executar olscomandos ou navegar diretórios, verifique oIndexFetcheIndexEvictionMetrics (CloudWatch):

  • Se oIndexFetchmétrica é maior que 0 quando você executa umlsComando ou navegar por diretórios, o gateway de arquivos começou sem informações sobre o conteúdo do diretório afetado e precisava acessar o Amazon S3. Os esforços subsequentes para listar o conteúdo desse diretório deverão ocorrer com mais rapidez.

  • Se oIndexEvictionA métrica é maior que 0, significa que o gateway de arquivos atingiu o limite do que pode gerenciar em seu cache no momento. Nesse caso, o gateway de arquivos precisa liberar espaço de armazenamento do diretório menos acessado recentemente para listar um novo diretório. Se isso ocorrer com frequência e houver um impacto no desempenho, entre em contatoAWS Support.

    Discutir comAWS SupportO conteúdo do sistema de arquivos do Amazon FSx relacionado e as recomendações para melhorar o desempenho com base no seu caso de uso.

Seu gateway não está respondendo

Se o gateway de arquivos não está respondendo, faça o seguinte:

  • Se essa foi uma reinicialização atual ou uma atualização de software, verifique a métrica IOWaitPercent. Essa métrica mostra a porcentagem de tempo que a CPU fica ociosa quando há uma solicitação de E/S de disco pendente. Em alguns casos, isso pode ser alto (10 ou mais) e pode ter aumentado depois que o servidor foi reinicializado ou atualizado. Nesses casos, o gateway de arquivos pode ser afunilado por um disco raiz lento à medida que recria o cache de índice para RAM. É possível resolver esse problema usando um disco físico mais rápido para o disco raiz.

  • Se oMemUsedBytesmétrica é quase igual ou quase a mesma que aMemTotalBytesEm seguida, o gateway de arquivos está ficando sem RAM disponível. Verifique se o gateway de arquivos tem pelo menos a RAM mínima necessária. Se já tiver, considere adicionar mais RAM ao gateway de arquivos com base na carga de trabalho e no caso de uso.

    Se o compartilhamento de arquivos for SMB, o problema também pode ser devido ao número de clientes SMB conectados ao compartilhamento de arquivos. Para ver o número de clientes conectados em determinado momento, verifique a métrica SMBV(1/2/3)Sessions. Se houver muitos clientes conectados, talvez seja necessário adicionar mais RAM ao gateway de arquivos.

Você não vê arquivos em seu sistema de arquivos Amazon FSx

Se você perceber que os arquivos no gateway não são refletidos no sistema de arquivos Amazon FSx, verifique aFilesFailingUploadMétrica do. Se a métrica informar que alguns arquivos estão falhando no upload, verifique suas notificações de integridade. Quando os arquivos falham ao carregar, o gateway gera uma notificação de integridade contendo mais detalhes sobre o problema.

Seu gateway está transferindo dados lentamente para o Amazon FSx

Se o gateway de arquivos estiver transferindo dados lentamente para o Amazon S3, faça o seguinte:

  • Se oCachePercentDirtyA métrica é 80 ou mais, significará que o gateway de arquivos está gravando dados mais rapidamente no disco do que pode fazer upload de dados no Amazon S3. Considere aumentar a largura de banda para upload do gateway de arquivos, adicionar um ou mais discos de cache ou desacelerar as gravações do cliente.

  • Se oCachePercentDirtymétrica baixa, verifique oIoWaitPercentMétrica do. SeIoWaitPercentÉ maior que 10, o gateway de arquivos pode ser afunilado pela velocidade do disco de cache local. Recomendamos discos de unidade de estado sólido (SSD) local para o cache, de preferência NVM Express (NVMe). Se esses discos não estiverem disponíveis, tente usar vários discos de cache de discos físicos separados para melhorar o desempenho.

Seu trabalho de backup do gateway falha ou há erros ao gravar no gateway

Se o trabalho de backup do gateway de arquivos falhar ou se houver erros ao gravar no gateway de arquivos, faça o seguinte:

  • Se oCachePercentDirtyA métrica é 90% ou acima, o gateway de arquivos não consegue aceitar novas gravações em disco porque não há espaço disponível suficiente no disco de cache. Para ver a velocidade em que o gateway de arquivos está fazendo upload para o Amazon FSx ou o Amazon S3, visualize aCloudBytesUploadedMétrica do. Compare essa métrica com oWriteBytes, que mostra a rapidez com que o cliente está gravando arquivos no gateway de arquivos. Se o gateway de arquivos estiver gravando mais rápido do que pode fazer upload no Amazon FSx ou Amazon S3, adicione mais discos de cache para cobrir, no mínimo, o tamanho do trabalho de backup. Ou aumente a largura de banda de upload.

  • Se um trabalho de backup falhar, mas oCachePercentDirtyA métrica for inferior a 80%, o gateway de arquivos pode estar atingindo um tempo limite de sessão no lado do cliente. Para SMB, é possível aumentar esse tempo limite usando o comando Set-SmbClientConfiguration -SessionTimeout 300 do PowerShell. A execução desse comando define o tempo limite para 300 segundos.

    Para o NFS, verifique se o cliente está montado usando uma montagem rígida em vez de uma montagem flexível.