Come risolvere i problemi del gateway di file - AWSStorage Gateway

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Come risolvere i problemi del gateway di file

Puoi configurare il gateway file con un gruppo di log Amazon CloudWatch quando esegui VMware vSphere High Availability (HA). In questo caso, vengono visualizzate le notifiche sullo stato di integrità del gateway file e sugli errori rilevati dal gateway file. Le informazioni su queste notifiche di errore e di integrità sono disponibili in CloudWatch Logs.

Nelle sezioni seguenti sono disponibili informazioni che consentono di comprendere la causa di ogni errore e notifica di integrità e come risolvere i problemi.

Errore: ObjectMissing

È possibile ottenere unObjectMissingErrore quando un writer diverso dal gateway file specificato elimina il file specificato da Amazon FSx. Eventuali caricamenti successivi in Amazon FSx o recuperi da Amazon FSx per l'oggetto non vanno a buon fine.

Per risolvere un errore ObjectMissing
  1. Salvare la copia più recente del file nel file system locale del client SMB (è necessaria questa copia file).

  2. Eliminare il file dal gateway di file utilizzando il client SMB.

  3. Copia la versione più recente del file salvato nella fase 1 Amazon FSx con il client SMB. Eseguire questa operazione tramite il gateway di file.

Notifica: Riavvio

Puoi ricevere una notifica di riavvio quando la VM del gateway viene riavviata. Puoi riavviare una macchina virtuale gateway utilizzando la console VM Hypervisor Management (Gestione hypervisor VM) o la console Storage Gateway. È inoltre possibile riavviare utilizzando il software del gateway durante il ciclo di manutenzione del gateway.

Se il riavvio viene eseguito entro 10 minuti dall'ora di avvio della manutenzione configurata del gateway, probabilmente è un evento normale e non un'indicazione di problema. Se il riavvio è stato eseguito al di fuori della finestra di manutenzione in modo significativo, verifica se il gateway è stato riavviato manualmente.

Notifica: HardReboot

Puoi ricevere una notifica HardReboot quando la VM del gateway viene riavviata in modo imprevisto. Questo riavvio può essere dovuto a mancanza di alimentazione, a un guasto hardware o a un altro evento. Per i gateway VMware, un ripristino da parte di vSphere High Availability Application Monitoring può attivare questo evento.

Quando il gateway viene eseguito in questo ambiente, verifica la presenza della notifica HealthCheckFailure e consulta il log degli eventi VMware per la macchina virtuale.

Notifica: HealthCheckFailure

Per un gateway su VMware vSphere HA, puoi ricevere una notifica HealthCheckFailure quando un controllo dello stato non riesce e viene richiesto un riavvio della macchina virtuale. Questo evento si verifica anche durante un test per monitorare la disponibilità, indicato da una notifica AvailabilityMonitorTest. In questo caso, la notifica HealthCheckFailure è prevista.

Nota

Questa notifica è solo per i gateway VMware.

Se questo evento si verifica ripetutamente senza notifica AvailabilityMonitorTest, verifica la presenza di problemi nell'infrastruttura VM (storage, memoria e così via). Se hai bisogno di ulteriore assistenza, contattaAWS Support.

Notifica: AvailabilityMonitorTest

Si ottiene unAvailabilityMonitorTestnotifica quando tueseguire un testdelControllo della disponibilità e delle applicazionisistema su gateway in esecuzione su una piattaforma VMware vSphere HA.

Errore: RoleTrustRelationshipInvalid

Questo errore viene visualizzato quando il ruolo IAM per una condivisione di file ha una relazione di trust IAM configurata in modo errato (ovvero, il ruolo IAM non considera attendibile l'principal Storage Gateway denominato.storagegateway.amazonaws.com). Di conseguenza, il gateway file non sarebbe in grado di ottenere le credenziali per eseguire le operazione sul bucket S3 che supporta la condivisione file.

Per risolvere un errore RoleTrustRelationshipInvalid

Risoluzione dei problemi con le metriche di CloudWatch

Di seguito è spiegato cosa fare per risolvere i problemi nell'utilizzo delle metriche Amazon CloudWatch con Storage Gateway.

Il gateway reagisce lentamente durante la navigazione delle directory

Se il gateway di file reagisce lentamente quando esegui il filelscomando o sfoglia directory, controlla ilIndexFetcheIndexEvictionMetrics CloudWatch:

  • Se il fileIndexFetchla metrica è maggiore di 0 quando si esegue unlscomando o esplori le directory, il gateway è stato avviato senza informazioni sul contenuto della directory interessata e ha dovuto accedere ad Amazon S3. Gli sforzi successivi per elencare i contenuti di tale directory dovrebbero avvenire più velocemente.

  • Se il fileIndexEvictionil parametro è maggiore di 0, significa che il gateway ha raggiunto il limite di ciò che può gestire nella cache in quel momento. In questo caso, il gateway di file deve liberare spazio di storage dalla directory a cui ha avuto accesso meno di recente per elencare una nuova directory. Se ciò si verifica frequentemente e si riscontra un impatto sulle prestazioni, contattareAWS Support.

    Discutere conAWS Supportil contenuto del file system Amazon FSx correlato e le raccomandazioni per migliorare le prestazioni in base al caso d'uso.

Il tuo gateway non risponde

Se il gateway di file non risponde, procedi come segue:

  • Se di recente è stato eseguito un riavvio o aggiornamento software, controlla il parametro IOWaitPercent. Questo parametro mostra la percentuale di tempo in cui la CPU è inattiva quando è presente una richiesta di I/O su disco in sospeso. In alcuni casi, questo valore potrebbe essere elevato (10 o maggiore) e potrebbe essere aumentato dopo il riavvio o l'aggiornamento del server. In questi casi, il gateway file potrebbe essere rallentato da un disco root lento mentre ricostruisce la cache dell'indice nella RAM. Puoi risolvere questo problema utilizzando un disco fisico più veloce per il disco root.

  • Se il fileMemUsedBytesmetrica è uguale o quasi uguale allaMemTotalBytesparametro, quindi il gateway di file sta esaurendo la RAM disponibile. Verificare che il gateway di file disponga almeno della RAM minima richiesta. In tal caso, considera l'aggiunta di più RAM al gateway file in base al carico di lavoro e al caso d'uso.

    Se la condivisione file è SMB, il problema potrebbe anche essere dovuto al numero di client SMB connessi alla condivisione file. Controlla il parametro SMBV(1/2/3)Sessions per vedere il numero di client connessi in un dato momento. Se sono presenti molti client connessi, potrebbe essere necessario aggiungere più RAM al gateway file.

Non vedi i file nel tuo file system Amazon FSx

Se noti che i file sul gateway non si riflettono nel file system Amazon FSx, controlla ilFilesFailingUploadParametri di Se la metrica segnala che alcuni file non sono stati caricati, controlla le notifiche dello stato. Quando i file non vengono caricati, il gateway genera una notifica di integrità contenente ulteriori dettagli sul problema.

Il gateway è lento durante il trasferimento dei dati ad Amazon FSx

Se il gateway di file è lento durante il trasferimento dei dati ad Amazon S3, procedi come segue:

  • Se il fileCachePercentDirtyLa metrica è pari o superiore a 80, il gateway file scrive i dati sul disco più velocemente di quanti ne possa caricare in Amazon S3. Prendi in considerazione l'aumento della larghezza di banda per il caricamento dal gateway file, l'aggiunta di uno o più dischi della cache o il rallentamento delle scritture client.

  • Se il fileCachePercentDirtyparametro è basso, controllaIoWaitPercentParametri di SeIoWaitPercentè maggiore di 10, il gateway file potrebbe essere rallentato dalla velocità del disco della cache locale. Consigliamo dischi SSD (Solid State Drive) locali per la cache, preferibilmente NVM Express (NVMe). Se questi dischi non sono disponibili, prova a utilizzare più dischi di cache da dischi fisici separati per migliorare le prestazioni.

Il processo di backup del gateway non riesce o si verificano errori durante la scrittura sul gateway

Se il processo di backup del gateway file non riesce o si verificano errori durante la scrittura nel gateway di file, effettuare le seguenti operazioni:

  • Se il fileCachePercentDirtyil parametro è pari o superiore al 90%, il gateway file non può accettare nuove scritture su disco perché non è disponibile spazio sufficiente sul disco della cache. Per verificare la velocità di caricamento del gateway di file su Amazon FSx o Amazon S3, consulta laCloudBytesUploadedParametri di Confronta quella metrica con laWriteBytesparametro, che mostra la velocità con cui il client sta scrivendo i file nel gateway di file. Se il gateway file scrive più velocemente di quanto possa caricare su Amazon FSx o Amazon S3, aggiungi più dischi della cache per coprire almeno la dimensione del processo di backup. In alternativa, aumenta la larghezza di banda di caricamento.

  • Se un processo di backup fallisce ma ilCachePercentDirtyLa metrica è inferiore all'80%, il gateway file potrebbe causare un timeout della sessione lato client. Per SMB, puoi aumentare questo timeout utilizzando il comando PowerShell Set-SmbClientConfiguration -SessionTimeout 300. L'esecuzione di questo comando imposta il timeout su 300 secondi.

    Per NFS, assicurati che il client sia montato utilizzando un hard mount anziché un soft mount.