Dépannage des problèmes de passerelle de fichiers - AWSStorage Gateway

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Dépannage des problèmes de passerelle de fichiers

Vous pouvez configurer votre passerelle de fichiers avec un groupe de journaux Amazon CloudWatch lorsque vous exécutez VMware vSphere High Availability (HA). Si vous le faites, vous recevez des notifications sur l'intégrité de votre passerelle de fichiers et sur les erreurs rencontrées par la passerelle de fichiers. Vous trouverez des informations sur ces notifications d'erreur et d'intégrité dans CloudWatch Logs.

Dans les sections suivantes, vous trouverez des informations qui peuvent vous aider à comprendre la cause de chaque notification d'erreur et d'intégrité et à résoudre les problèmes.

Erreur: ObjectMissing

Vous pouvez obtenir unObjectMissingerreur lorsqu'un dispositif d'écriture autre que la passerelle de fichiers spécifiée supprime le fichier spécifié d'Amazon FSx. Tous les chargements suivants sur Amazon FSx ou extractions à partir d'Amazon FSx pour l'objet échouent.

Pour résoudre une erreur ObjectMissing
  1. Enregistrez la dernière copie du fichier dans le système de fichiers local de votre client SMB (vous avez besoin de cette copie de fichier à l'étape 3).

  2. Supprimez le fichier de la passerelle de fichiers à l'aide de votre client SMB.

  3. Copiez la dernière version du fichier que vous avez enregistrée à l'étape 1 Amazon FSx à l'aide de votre client SMB. Pour ce faire, utilisez votre passerelle de fichiers.

: Notification Redémarrer

Vous pouvez obtenir une notification de redémarrage lorsque la machine virtuelle de la passerelle est redémarrée. Vous pouvez redémarrer une machine virtuelle de passerelle à l'aide de la console de gestion des hyperviseurs de VM ou de Storage Gateway Console. Vous pouvez également la redémarrer à l'aide du logiciel de la passerelle pendant le cycle de maintenance de la passerelle.

Si l'heure du redémarrage se situe dans les 10 minutes de l'heure de démarrage de la maintenance configurée de la passerelle, ce redémarrage est probablement une occurrence normale et non un signe de problème. Si le redémarrage s'est produit largement en dehors de la fenêtre de maintenance, vérifiez si la passerelle a été redémarrée manuellement.

: Notification HardReboot

Vous pouvez obtenir une notification HardReboot lorsque la machine virtuelle de la passerelle est redémarrée de façon inattendue. Un tel redémarrage peut être dû à une perte de puissance, à une défaillance matérielle ou à un autre événement. Pour les passerelles VMware, une réinitialisation par la surveillance de l’application vSphere High Availability peut déclencher cet événement.

Lorsque votre passerelle s'exécute dans un tel environnement, vérifiez la présence de la notification HealthCheckFailure et consultez le journal des événements VMware pour la machine virtuelle.

: Notification HealthCheckFailure

Pour une passerelle sur VMware vSphere HA, vous pouvez recevoir une notification HealthCheckFailure lorsqu'une vérification de l’état échoue et qu'un redémarrage de la machine virtuelle est demandé. Cet événement se produit également lors d'un test de surveillance de la disponibilité, indiqué par une notification AvailabilityMonitorTest. Dans ce cas, la notification HealthCheckFailure est attendue.

Note

Cette notification concerne uniquement les passerelles VMware.

Si cet événement se produit à plusieurs reprises sans notification AvailabilityMonitorTest, recherchez les problèmes éventuels de votre infrastructure de machine virtuelle (stockage, mémoire, etc.). Si vous avez besoin d'aide supplémentaire, contactezAWS Support.

: Notification AvailabilityMonitorTest

Vous obtenez unAvailabilityMonitorTestnotification lorsque vousexécuter un testduSurveillance de la disponibilité et des applicationssystème sur passerelles exécutées sur une plateforme VMware vSphere HA.

Erreur: RoleTrustRelationshipInvalid

Vous obtenez cette erreur lorsque le rôle IAM pour un partage de fichiers présente une relation d'approbation IAM mal configurée (autrement dit, le rôle IAM ne fait pas confiance au mandataire Storage Gateway nomméstoragegateway.amazonaws.com). Par conséquent, la passerelle de fichiers ne serait pas en mesure d'obtenir les informations d'identification pour exécuter des opérations sur le compartiment S3 qui soutient le partage de fichiers.

Pour résoudre une erreur RoleTrustRelationshipInvalid

Dépannage des métriques CloudWatch

Vous trouverez ci-après des informations sur les actions visant à résoudre les problèmes liés à l'utilisation des métriques Amazon CloudWatch avec Storage Gateway.

Votre passerelle réagit lentement lorsque vous parcourez des répertoires

Si votre passerelle de fichiers réagit lentement lorsque vous exécutez lelsou parcourez les répertoires, vérifiez laIndexFetchetIndexEvictionmesures CloudWatch :

  • Si l'icôneIndexFetchest supérieure à 0 lorsque vous exécutez unlsou naviguez dans les répertoires, votre passerelle de fichiers a démarré sans informations sur le contenu du répertoire concerné et a dû accéder à Amazon S3. Les opérations ultérieures pour répertorier le contenu de ce répertoire devraient s'exécuter plus rapidement.

  • Si l'icôneIndexEvictionLa métrique est supérieure à 0, cela signifie que votre passerelle de fichiers a atteint la limite de ce qu'elle peut gérer dans son cache à ce moment-là. Dans ce cas, votre passerelle de fichiers doit libérer de l'espace de stockage du répertoire le moins récemment consulté pour répertorier un nouveau répertoire. Si cela se produit fréquemment et qu'il y a un impact sur les performances, contactezAWS Support.

    Discutez avecAWS Supportle contenu du système de fichiers Amazon FSx associé et les recommandations visant à améliorer les performances en fonction de votre cas d'utilisation.

Votre passerelle ne répond pas

Si votre passerelle de fichiers ne répond pas, procédez comme suit :

  • Dans le cas d'une mise à jour logicielle ou d’un redémarrage récent, vérifiez la métrique IOWaitPercent. Cette métrique indique le pourcentage de temps pendant lequel le processeur est inactif lorsqu'une demande d’E/S disque est en attente. Dans certains cas, ce pourcentage peut être élevé (10 ou plus) et peut avoir augmenté après le redémarrage ou la mise à jour du serveur. Dans ces cas, votre passerelle de fichiers peut être limitée par un disque racine lent pendant la reconstitution du cache d'index en RAM. Vous pouvez résoudre ce problème en utilisant un disque physique plus rapide pour le disque racine.

  • Si l'icôneMemUsedBytesest égale ou presque identique à la mesureMemTotalBytes, votre passerelle de fichiers est à court de RAM disponible. Assurez-vous que votre passerelle de fichiers dispose au moins de la RAM minimale requise. Si c'est déjà le cas, envisagez d'ajouter plus de RAM à votre passerelle de fichiers en fonction de votre charge de travail et de votre cas d'utilisation.

    Si le partage de fichiers est SMB, le problème peut également être dû au nombre de clients SMB connectés au partage de fichiers. Pour connaître le nombre de clients connectés à un moment donné, vérifiez la métrique SMBV(1/2/3)Sessions. Si de nombreux clients sont connectés, vous devrez peut-être ajouter plus de RAM à votre passerelle de fichiers.

Vous ne voyez pas de fichiers dans votre système de fichiers Amazon FSx

Si vous remarquez que les fichiers de la passerelle ne sont pas reflétés dans le système de fichiers Amazon FSx, vérifiez leFilesFailingUploadMétriques. Si la mesure indique que certains fichiers ne sont pas chargés, vérifiez vos notifications de santé. Lorsque les fichiers ne parviennent pas à charger, la passerelle génère une notification d'intégrité contenant plus de détails sur le problème.

Votre passerelle met du temps à transférer des données vers Amazon FSx

Si votre passerelle de fichiers est lente lors du transfert de données vers Amazon S3, procédez comme suit :

  • Si l'icôneCachePercentDirtyLa métrique est égale ou supérieure à 80, votre passerelle de fichiers écrit des données plus rapidement sur le disque qu'elle ne peut charger les données dans Amazon S3. Pensez à augmenter la bande passante pour le chargement à partir de votre passerelle de fichiers, à ajouter un ou plusieurs disques de cache ou à ralentir les écritures client.

  • Si l'icôneCachePercentDirtyMétriques présente une valeur peu élevée, vérifiez l'IoWaitPercentMétriques. SiIoWaitPercentest supérieure à 10, votre passerelle de fichiers peut être limitée par la vitesse du disque de cache local. Nous recommandons des disques SSD (Solid State Drive) locaux pour votre cache, de préférence NVM Express (NVMe). Si de tels disques ne sont pas disponibles, essayez d'utiliser plusieurs disques de cache provenant de disques physiques distincts pour améliorer les performances.

Votre tâche de sauvegarde de passerelle échoue ou des erreurs se produisent lors de l'écriture sur votre passerelle.

Si votre tâche de sauvegarde de passerelle de fichiers échoue ou si des erreurs se produisent lors de l'écriture sur votre passerelle de fichiers, procédez comme suit :

  • Si l'icôneCachePercentDirtyLa métrique est égale ou supérieure à 90 %, votre passerelle de fichiers ne peut pas accepter de nouvelles écritures sur le disque car l'espace disponible sur le disque de cache est insuffisant. Pour connaître la vitesse des chargements entre votre passerelle de fichiers et sur Amazon FSx ou Amazon S3, consultez leCloudBytesUploadedMétriques. Comparez cette mesure avec leWriteBytes, qui indique la vitesse à laquelle le client écrit des fichiers sur votre passerelle de fichiers. Si votre passerelle de fichiers écrit plus rapidement qu'elle ne peut charger sur Amazon FSx ou Amazon S3, ajoutez plus de disques de cache pour couvrir au minimum la taille de la tâche de sauvegarde. Vous pouvez également augmenter la bande passante de chargement.

  • Si une tâche de sauvegarde échoue, mais que la commandeCachePercentDirtyest inférieure à 80 %, votre passerelle de fichiers est peut-être confrontée à un délai d'expiration de session côté client. Pour SMB, vous pouvez augmenter ce délai d'expiration à l'aide de la commande PowerShell Set-SmbClientConfiguration -SessionTimeout 300. L'exécution de cette commande définit le délai d'expiration à 300 secondes.

    Pour NFS, assurez-vous que le client est monté à l'aide d'un montage physique et non d'un montage logiciel.