Gestion du stockage sur FSx for Windows File Server - Amazon FSx for Windows File Server

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Gestion du stockage sur FSx for Windows File Server

La configuration de stockage de votre système de fichiers inclut la quantité de capacité de stockage allouée, le type de stockage et, s'il s'agit d'un disque SSD, le nombre d'IOPS SSD. Vous pouvez configurer ces ressources, ainsi que la capacité de débit du système de fichiers, lors de la création d'un système de fichiers et après sa création, afin d'obtenir les performances souhaitées pour votre charge de travail. Découvrez comment gérer le stockage de votre système de fichiers et les performances liées au stockage à l'aide de AWS Management Console AWS CLI, et de la CLI Amazon FSx pour la gestion à distance PowerShell en explorant les rubriques suivantes.

Optimisation des coûts de stockage

Vous pouvez optimiser vos coûts de stockage à l'aide des options de configuration de stockage disponibles dans FSx pour Windows.

Options de type de stockage : FSx pour Windows File Server propose deux types de stockage, les disques durs (HDD) et les disques SSD, pour vous permettre d'optimiser les coûts et les performances afin de répondre aux besoins de votre charge de travail. Le stockage sur disque dur est conçu pour un large éventail de charges de travail, notamment les répertoires personnels, les partages entre utilisateurs et départements et les systèmes de gestion de contenu. Le stockage SSD est conçu pour les charges de travail les plus performantes et les plus sensibles à la latence, notamment les bases de données, les charges de travail de traitement multimédia et les applications d'analyse de données. Pour plus d'informations sur les types de stockage et les performances des systèmes de fichiers, consultezPerformances de FSx for Windows File Server.

Déduplication des données : les grands ensembles de données contiennent souvent des données redondantes, ce qui augmente les coûts de stockage des données. Par exemple, les partages de fichiers utilisateur peuvent contenir plusieurs copies du même fichier, stockées par plusieurs utilisateurs. Les partages de développement logiciel peuvent contenir de nombreux fichiers binaires qui restent inchangés d'une version à l'autre. Vous pouvez réduire les coûts de stockage des données en activant la déduplication des données pour votre système de fichiers. Lorsqu'elle est activée, la déduplication des données réduit ou élimine automatiquement les données redondantes en ne stockant qu'une seule fois les parties dupliquées du jeu de données. Pour plus d'informations sur la déduplication des données et sur la manière de l'activer facilement pour votre système de fichiers Amazon FSx, consultez. Réduction des coûts de stockage grâce à la déduplication des données

Gestion de la capacité de stockage

Vous pouvez augmenter la capacité de stockage de votre système de fichiers FSx pour Windows en fonction de l'évolution de vos besoins en stockage. Vous pouvez le faire à l'aide de la console Amazon FSx, de l'API Amazon FSx ou du (). AWS Command Line Interface AWS CLI Les facteurs à prendre en compte lors de la planification d'une augmentation de capacité de stockage incluent le fait de savoir quand vous devez augmenter la capacité de stockage, de comprendre comment Amazon FSx traite les augmentations de capacité de stockage et de suivre l'évolution d'une demande d'augmentation de la capacité de stockage. Vous pouvez uniquement augmenter la capacité de stockage d'un système de fichiers ; vous ne pouvez pas la diminuer.

Note

Vous ne pouvez pas augmenter la capacité de stockage des systèmes de fichiers créés avant le 23 juin 2019 ou des systèmes de fichiers restaurés à partir d'une sauvegarde appartenant à un système de fichiers créé avant le 23 juin 2019.

Lorsque vous augmentez la capacité de stockage de votre système de fichiers Amazon FSx, Amazon FSx ajoute en arrière-plan un nouvel ensemble de disques plus volumineux à votre système de fichiers. Amazon FSx exécute ensuite un processus d'optimisation du stockage en arrière-plan afin de migrer de manière transparente les données des anciens disques vers les nouveaux disques. L'optimisation du stockage peut prendre de quelques heures à quelques jours, avec un impact notable minime sur les performances de la charge de travail. Au cours de cette optimisation, l'utilisation des sauvegardes est temporairement plus élevée, car les anciens et les nouveaux volumes de stockage sont inclus dans les sauvegardes au niveau du système de fichiers. Les deux ensembles de volumes de stockage sont inclus pour garantir qu'Amazon FSx puisse prendre et restaurer avec succès à partir de sauvegardes, même pendant les activités de dimensionnement du stockage. L'utilisation des sauvegardes revient à son niveau de référence précédent une fois que les anciens volumes de stockage ne sont plus inclus dans l'historique des sauvegardes. Lorsque la nouvelle capacité de stockage est disponible, seule la nouvelle capacité de stockage vous est facturée.

L'illustration suivante montre les quatre étapes principales du processus utilisé par Amazon FSx pour augmenter la capacité de stockage d'un système de fichiers.

Schéma montrant les 4 étapes : 1. Demande d'augmentation de la capacité de stockage, 2. FSx ajoute de nouveaux disques plus grands, 3. FSx migre les données, et 4. FSx supprime les anciens disques.

Vous pouvez suivre la progression de l'optimisation du stockage, de l'augmentation de la capacité de stockage SSD ou des mises à jour des IOPS SSD à tout moment à l'aide de la console, de la CLI ou de l'API Amazon FSx. Pour plus d’informations, consultez Surveillance de l'augmentation de la capacité de stockage.

Ce qu'il faut savoir sur l'augmentation de la capacité de stockage d'un système de fichiers

Voici quelques points importants à prendre en compte lors de l'augmentation de la capacité de stockage :

  • Augmenter uniquement : vous pouvez uniquement augmenter la capacité de stockage d'un système de fichiers ; vous ne pouvez pas diminuer la capacité de stockage.

  • Augmentation minimale : chaque augmentation de capacité de stockage doit être d'au moins 10 % de la capacité de stockage actuelle du système de fichiers, jusqu'à la valeur maximale autorisée de 65 536 GiB.

  • Capacité de débit minimale : pour augmenter la capacité de stockage, un système de fichiers doit avoir une capacité de débit minimale de 16 Mo/s. Cela est dû au fait que l'étape d'optimisation du stockage est un processus gourmand en débit.

  • Intervalle entre les augmentations : vous ne pouvez pas augmenter davantage la capacité de stockage d'un système de fichiers jusqu'à 6 heures après la dernière demande d'augmentation ou avant la fin du processus d'optimisation du stockage, selon le délai le plus long. L'optimisation du stockage peut prendre de quelques heures à quelques jours. Pour réduire le temps nécessaire à l'optimisation du stockage, nous vous recommandons d'augmenter la capacité de débit de votre système de fichiers avant d'augmenter la capacité de stockage (la capacité de débit peut être réduite une fois le dimensionnement du stockage terminé), et d'augmenter la capacité de stockage lorsque le trafic sur le système de fichiers est minimal.

Note

Certains événements du système de fichiers peuvent consommer les ressources de performance des E/S du disque. Par exemple :

La phase d'optimisation de la mise à l'échelle de la capacité de stockage peut générer une augmentation du débit du disque et éventuellement provoquer des avertissements en matière de performances. Pour plus d’informations, consultez Avertissements et recommandations en matière de performances.

Savoir quand augmenter la capacité de stockage

Augmentez la capacité de stockage de votre système de fichiers lorsque la capacité de stockage disponible est insuffisante. Utilisez cette FreeStorageCapacity CloudWatch métrique pour contrôler la quantité de stockage gratuit disponible sur le système de fichiers. Vous pouvez créer une CloudWatch alarme Amazon sur cette métrique et être averti lorsqu'elle tombe en dessous d'un seuil spécifique. Pour plus d’informations, consultez Surveillance avec Amazon CloudWatch.

Nous vous recommandons de conserver à tout moment au moins 10 % de la capacité de stockage disponible sur votre système de fichiers. L'utilisation de l'ensemble de votre capacité de stockage peut avoir un impact négatif sur vos performances et entraîner des incohérences dans les données.

Vous pouvez augmenter automatiquement la capacité de stockage de votre système de fichiers lorsque la capacité de stockage disponible tombe en dessous d'un seuil défini que vous spécifiez. Utilisez le AWS AWS CloudFormation modèle personnalisé développé pour déployer tous les composants nécessaires à la mise en œuvre de la solution automatisée. Pour plus d’informations, consultez Augmenter la capacité de stockage de manière dynamique.

Augmentation de la capacité de stockage et des performances du système de fichiers

La plupart des charges de travail ont un impact minimal sur les performances tandis qu'Amazon FSx exécute le processus d'optimisation du stockage en arrière-plan une fois que la nouvelle capacité de stockage est disponible. Les applications gourmandes en écriture avec de grands ensembles de données actifs peuvent temporairement voir leurs performances d'écriture réduites de moitié. Dans ces cas, vous pouvez d'abord augmenter la capacité de débit de votre système de fichiers avant d'augmenter la capacité de stockage. Cela vous permet de continuer à fournir le même niveau de débit pour répondre aux besoins de performance de votre application. Pour plus d’informations, consultez Gestion de la capacité de débit sur les systèmes de fichiers FSx for Windows File Server.

Gestion du type de stockage de votre système de fichiers FSx pour Windows

Vous pouvez modifier le type de stockage de votre système de fichiers du disque dur au format SSD à l'aide des AWS Management Console touches et AWS CLI. Lorsque vous remplacez le type de stockage par SSD, n'oubliez pas que vous ne pouvez pas mettre à jour à nouveau la configuration de votre système de fichiers jusqu'à ce que la dernière mise à jour ait été demandée ou avant que le processus d'optimisation du stockage ne soit terminé, selon le délai le plus long. L'optimisation du stockage peut prendre entre quelques heures et quelques jours. Pour réduire ce temps, nous vous recommandons de mettre à jour votre type de stockage lorsque le trafic sur votre système de fichiers est minimal. Pour plus d’informations, consultez Mise à jour du type de stockage d'un système de fichiers FSx pour Windows.

Vous ne pouvez pas modifier le type de stockage de votre système de fichiers de SSD à HDD. Si vous souhaitez remplacer le type de stockage d'un système de fichiers HDD par SSD, vous devez restaurer une sauvegarde du système de fichiers sur un nouveau système de fichiers que vous avez configuré pour utiliser le stockage sur disque dur. Pour plus d’informations, consultez Restauration des sauvegardes vers un nouveau système de fichiers.

À propos des types de stockage

Vous pouvez configurer votre système de fichiers FSx for Windows File Server pour qu'il utilise le type de stockage SSD ou HDD.

Le stockage SSD convient à la plupart des charges de travail de production soumises à des exigences de performances élevées et à une sensibilité à la latence. Des exemples de ces charges de travail incluent les bases de données, l'analyse des données, le traitement multimédia et les applications commerciales. Nous recommandons également le SSD pour les cas d'utilisation impliquant un grand nombre d'utilisateurs finaux, des niveaux élevés d'E/S ou des ensembles de données contenant un grand nombre de petits fichiers. Enfin, nous vous recommandons d'utiliser le stockage SSD si vous prévoyez d'activer les copies instantanées. Vous pouvez configurer et dimensionner les IOPS SSD pour les systèmes de fichiers dotés d'un stockage SSD, mais pas d'un stockage sur disque dur.

Le stockage sur disque dur est conçu pour un large éventail de charges de travail, notamment les répertoires personnels, les partages de fichiers entre utilisateurs et départements et les systèmes de gestion de contenu. Le stockage sur disque dur est moins coûteux que le stockage SSD, mais avec des latences plus élevées et des niveaux inférieurs de débit et d'IOPS par unité de stockage. Il peut convenir aux partages utilisateur à usage général et aux répertoires personnels nécessitant peu d'E/S, aux grands systèmes de gestion de contenu (CMS) dans lesquels les données sont rarement récupérées, ou aux ensembles de données contenant un petit nombre de fichiers volumineux.

Pour plus d’informations, consultez Configuration et performances du stockage.

Gestion des IOPS sur SSD

Pour les systèmes de fichiers configurés avec un stockage SSD, la quantité d'IOPS SSD détermine la quantité d'E/S disque disponible lorsque votre système de fichiers doit lire et écrire des données sur le disque, par opposition aux données en cache. Vous pouvez sélectionner et ajuster le nombre d'IOPS du SSD indépendamment de la capacité de stockage. Le nombre maximal d'IOPS sur SSD que vous pouvez provisionner dépend de la capacité de stockage et de la capacité de débit que vous sélectionnez pour votre système de fichiers. Si vous essayez d'augmenter le nombre d'IOPS de votre SSD au-dessus de la limite prise en charge par votre capacité de débit, vous devrez peut-être augmenter votre capacité de débit pour atteindre ce niveau d'IOPS sur SSD. Pour plus d’informations, consultez Performances de FSx for Windows File Server et Gestion de la capacité de débit sur les systèmes de fichiers FSx for Windows File Server.

Voici quelques points importants à connaître sur la mise à jour des IOPS SSD provisionnés d'un système de fichiers :

  • Choix d'un mode IOPS : vous avez le choix entre deux modes IOPS :

    • Automatique : choisissez ce mode et Amazon FSx adaptera automatiquement les IOPS de votre SSD afin de maintenir 3 IOPS par GiB de capacité de stockage, soit jusqu'à 400 000 IOPS par SSD par système de fichiers.

    • Provisionné par l'utilisateur : choisissez ce mode afin de pouvoir spécifier le nombre d'IOPS SSD compris entre 96 et 400 000. Spécifiez un nombre compris entre 3 et 50 IOPS par GiB de capacité de stockage pour tous les sites où Régions AWS Amazon FSx est disponible, ou entre 3 et 500 IOPS par GiB de capacité de stockage dans l'est des États-Unis (Virginie du Nord), l'ouest des États-Unis (Oregon), l'est des États-Unis (Ohio), l'Europe (Irlande), l'Asie-Pacifique (Tokyo) et l'Asie-Pacifique (Singapour). Lorsque vous choisissez le mode fourni par l'utilisateur et que le nombre d'IOPS SSD que vous spécifiez n'est pas d'au moins 3 IOPS par GiB, la demande échoue. Pour des niveaux plus élevés d'IOPS sur SSD provisionnés, vous payez pour une moyenne d'IOPS supérieure à 3 IOPS par GiB et par système de fichiers.

  • Mises à jour de la capacité de stockage : si vous augmentez la capacité de stockage de votre système de fichiers et que cette quantité nécessite par défaut une quantité d'IOPS SSD supérieure au niveau d'IOPS SSD actuellement fourni par l'utilisateur, Amazon FSx fait automatiquement passer votre système de fichiers en mode automatique et votre système de fichiers disposera d'un minimum de 3 IOPS SSD par GiB de capacité de stockage.

  • Mises à jour de la capacité de débit : si vous augmentez votre capacité de débit et que le nombre maximal d'IOPS SSD pris en charge par votre nouvelle capacité de débit est supérieur au niveau d'IOPS SSD fourni par l'utilisateur, Amazon FSx fait automatiquement passer votre système de fichiers en mode automatique.

  • Fréquence des IOPS sur SSD : vous ne pouvez pas augmenter davantage les IOPS du SSD, augmenter la capacité de débit ou mettre à jour le type de stockage sur un système de fichiers jusqu'à 6 heures après la dernière demande d'augmentation ou avant la fin du processus d'optimisation du stockage, selon le délai le plus long. L'optimisation du stockage peut prendre de quelques heures à quelques jours. Pour réduire le temps nécessaire à l'optimisation du stockage, nous recommandons de dimensionner les IOPS des SSD lorsque le trafic sur le système de fichiers est minimal.

Note

Notez que les niveaux de capacité de débit supérieurs ou égaux à 4 608 Mbit/s ne sont pris en charge que dans les pays suivants Régions AWS : USA Est (Virginie du Nord), USA Ouest (Oregon), USA Est (Ohio), Europe (Irlande), Asie-Pacifique (Tokyo) et Asie-Pacifique (Singapour).

Pour plus d'informations sur la manière de mettre à jour le nombre d'IOPS SSD provisionnées pour votre système de fichiers FSx for Windows File Server, consultez. Mettre à jour les IOPS SSD d'un système de fichiers

Réduction des coûts de stockage grâce à la déduplication des données

La déduplication des données, souvent appelée « déduplication » en abrégé, aide les administrateurs du stockage à réduire les coûts associés à la duplication des données. Avec FSx for Windows File Server, vous pouvez utiliser Microsoft Data Deduplication pour identifier et éliminer les données redondantes. Les grands ensembles de données contiennent souvent des données redondantes, ce qui augmente les coûts de stockage des données. Par exemple :

  • Les partages de fichiers utilisateur peuvent contenir de nombreuses copies de fichiers identiques ou similaires.

  • Les partages de développement logiciel peuvent comporter de nombreux fichiers binaires qui restent inchangés d'une version à l'autre.

Vous pouvez réduire les coûts de stockage des données en activant la déduplication des données pour votre système de fichiers. La déduplication des données réduit ou élimine les données redondantes en ne stockant qu'une seule fois les parties dupliquées du jeu de données. Lorsque vous activez la déduplication des données, la compression des données est activée par défaut, ce qui permet de compresser les données après la déduplication pour réaliser des économies supplémentaires. La déduplication des données optimise les redondances sans compromettre la fidélité ou l'intégrité des données. La déduplication des données s'exécute comme un processus d'arrière-plan qui analyse et optimise continuellement et automatiquement votre système de fichiers, et elle est transparente pour vos utilisateurs et clients connectés.

Les économies de stockage que vous pouvez réaliser grâce à la déduplication des données dépendent de la nature de votre ensemble de données, notamment du niveau de duplication existant entre les fichiers. En général, les économies réalisées sont de 50 à 60 % en moyenne pour les partages de fichiers à usage général. En ce qui concerne les actions, les économies vont de 30 à 50 % pour les documents utilisateur à 70 à 80 % pour les ensembles de données de développement logiciel. Vous pouvez mesurer les économies potentielles liées à la déduplication à l'aide de la PowerShell commande Measure-FSxDedupFileMetadata à distance décrite ci-dessous.

Vous pouvez également personnaliser la déduplication des données pour répondre à vos besoins de stockage spécifiques. Par exemple, vous pouvez configurer la déduplication pour qu'elle s'exécute uniquement sur certains types de fichiers, ou vous pouvez créer un calendrier de travail personnalisé. Les tâches de déduplication pouvant consommer les ressources du serveur de fichiers, nous vous recommandons de surveiller l'état de vos tâches de déduplication à l'aide de la Get-FSxDedupStatus commande décrite ci-dessous.

Pour plus d'informations sur la déduplication des données, consultez la documentation Microsoft Understanding Data Deduplication.

Note

Consultez nos meilleures pratiques pourBonnes pratiques lors de l'utilisation de la déduplication des données. Si vous rencontrez des problèmes pour exécuter correctement les tâches de déduplication des données, consultezRésolution des problèmes de déduplication des données.

Avertissement

Il n'est pas recommandé d'exécuter certaines commandes Robocopy avec déduplication des données, car ces commandes peuvent avoir un impact sur l'intégrité des données du Chunk Store. Pour plus d'informations, consultez la documentation relative à l'interopérabilité avec Microsoft Data Deduplication.

Bonnes pratiques lors de l'utilisation de la déduplication des données

Voici quelques bonnes pratiques pour utiliser la déduplication des données :

  • Planifiez les tâches de déduplication des données pour qu'elles s'exécutent lorsque votre système de fichiers est inactif : la planification par défaut inclut une GarbageCollection tâche hebdomadaire à 2h45 UTC le samedi. Cette opération peut prendre plusieurs heures si votre système de fichiers enregistre une importante perte de données. Si cette période n'est pas idéale pour votre charge de travail, planifiez l'exécution de cette tâche à un moment où vous vous attendez à un faible trafic sur votre système de fichiers.

  • Configurez une capacité de débit suffisante pour que la déduplication des données soit terminée : des capacités de débit plus élevées fournissent des niveaux de mémoire plus élevés. Microsoft recommande de disposer de 1 Go de mémoire pour 1 To de données logiques pour exécuter la déduplication des données. Utilisez le tableau des performances d'Amazon FSx pour déterminer la mémoire associée à la capacité de débit de votre système de fichiers et vous assurer que les ressources de mémoire sont suffisantes pour la taille de vos données.

  • Personnalisez les paramètres de déduplication des données pour répondre à vos besoins de stockage spécifiques et réduire les exigences en matière de performances : vous pouvez limiter l'optimisation pour qu'elle s'exécute sur des types de fichiers ou des dossiers spécifiques, ou définir une taille et un âge de fichier minimaux pour l'optimisation. Pour en savoir plus, veuillez consulter la section Réduction des coûts de stockage grâce à la déduplication des données.

Gestion de la déduplication des données

Vous pouvez gérer la déduplication des données sur votre système de fichiers à l'aide de l'interface de ligne de commande Amazon FSx pour la gestion à distance PowerShell sur. Pour plus d'informations sur l'utilisation de la gestion à distance de l'interface de ligne de commande Amazon FSx sur PowerShell, consultez. Utilisation de l'interface de ligne de commande Amazon FSx pour PowerShell

Vous trouverez ci-dessous les commandes que vous pouvez utiliser pour la déduplication des données.

Commande de déduplication des données Description

Enable-FSxDedup

Permet la déduplication des données sur le partage de fichiers. La compression des données après déduplication est activée par défaut lorsque vous activez la déduplication des données.

Disable-FSxDedup

Désactive la déduplication des données sur le partage de fichiers.

Get-FSxDedupConfiguration

Récupère les informations de configuration de la déduplication, notamment la taille et l'âge minimaux des fichiers pour l'optimisation, les paramètres de compression et les types de fichiers et dossiers exclus.

Set-FSxDedupConfiguration

Modifie les paramètres de configuration de la déduplication, notamment la taille et l'âge minimaux des fichiers pour l'optimisation, les paramètres de compression et les types de fichiers et dossiers exclus.

Get-FSxDedupStatus

Récupérez l'état de déduplication et incluez des propriétés en lecture seule qui décrivent les économies d'optimisation et l'état du système de fichiers, les délais et l'état d'achèvement des dernières tâches de déduplication sur le système de fichiers.

Get-FSxDedupMetadata

Récupère les métadonnées d'optimisation de la déduplication.

Update-FSxDedupStatus

Calcule et extrait des informations actualisées sur les économies réalisées grâce à la déduplication des données.

Measure-FSxDedupFileMetadata

Mesure et extrait l'espace de stockage potentiel que vous pouvez récupérer sur votre système de fichiers si vous supprimez un groupe de dossiers. Les fichiers contiennent souvent des fragments partagés entre d'autres dossiers, et le moteur de déduplication calcule quels fragments sont uniques et devraient être supprimés.

Get-FSxDedupSchedule

Récupère les programmes de déduplication actuellement définis.

New-FSxDedupSchedule

Créez et personnalisez un calendrier de déduplication des données.

Set-FSxDedupSchedule

Modifiez les paramètres de configuration pour les programmes de déduplication de données existants.

Remove-FSxDedupSchedule

Supprimez un calendrier de déduplication.

Get-FSxDedupJob

Obtenez le statut et les informations de toutes les tâches de déduplication en cours d'exécution ou en attente.

Stop-FSxDedupJob

Annulez une ou plusieurs tâches de déduplication de données spécifiées.

L'aide en ligne de chaque commande fournit une référence de toutes les options de commande. Pour accéder à cette aide, exécutez la commande avec-?, par exempleEnable-FSxDedup -?.

Activation de la déduplication des données

Vous activez la déduplication des données sur un partage de fichiers Amazon FSx for Windows File Server à l'aide de Enable-FSxDedup la commande suivante.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Enable-FsxDedup }

Lorsque vous activez la déduplication des données, une planification et une configuration par défaut sont créées. Vous pouvez créer, modifier et supprimer des plannings et des configurations à l'aide des commandes ci-dessous.

Vous pouvez utiliser cette Disable-FSxDedup commande pour désactiver complètement la déduplication des données sur votre système de fichiers.

Création d'un calendrier de déduplication des données

Même si le calendrier par défaut fonctionne bien dans la plupart des cas, vous pouvez créer un nouveau calendrier de déduplication à l'aide de la New-FsxDedupSchedule commande illustrée ci-dessous. Les programmes de déduplication des données utilisent l'heure UTC.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock { New-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Wed,Sat -Start 08:00 -DurationHours 7 }

Cette commande crée un calendrier nommé CustomOptimization qui s'exécute les jours du lundi, du mercredi et du samedi, en commençant le travail à 8 h 00 (UTC) chaque jour, avec une durée maximale de 7 heures, après quoi le travail s'arrête s'il est toujours en cours d'exécution.

Notez que la création de nouveaux plannings de tâches de déduplication personnalisés ne remplace ni ne supprime le planning par défaut existant. Avant de créer une tâche de déduplication personnalisée, vous souhaiterez peut-être désactiver la tâche par défaut si vous n'en avez pas besoin.

Vous pouvez désactiver le calendrier de déduplication par défaut à l'aide de la Set-FsxDedupSchedule commande illustrée ci-dessous.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Set-FSxDedupSchedule -Name “BackgroundOptimization” -Enabled $false}

Vous pouvez supprimer un calendrier de déduplication à l'aide de la Remove-FSxDedupSchedule -Name "ScheduleName" commande. Notez que le calendrier de BackgroundOptimization déduplication par défaut ne peut être ni modifié ni supprimé et qu'il devra être désactivé à la place.

Modification d'un calendrier de déduplication des données

Vous pouvez modifier un calendrier de déduplication existant à l'aide de la Set-FsxDedupSchedule commande illustrée ci-dessous.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Tues,Wed,Sat -Start 09:00 -DurationHours 9 }

Cette commande modifie le CustomOptimization calendrier existant pour qu'il s'exécute les jours du lundi au mercredi et le samedi, en commençant le travail à 9 h 00 (UTC) chaque jour, avec une durée maximale de 9 heures, après quoi le travail s'arrête s'il est toujours en cours d'exécution.

Pour modifier l'âge minimum du fichier avant d'optimiser le paramètre, utilisez la Set-FSxDedupConfiguration commande.

Afficher la quantité d'espace économisé

Pour afficher la quantité d'espace disque que vous économisez grâce à l'exécution de la déduplication des données, utilisez la Get-FSxDedupStatus commande suivante.

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FsxRemoteAdmin -ScriptBlock { Get-FSxDedupStatus } | select OptimizedFilesCount,OptimizedFilesSize,SavedSpace,OptimizedFilesSavingsRate OptimizedFilesCount OptimizedFilesSize SavedSpace OptimizedFilesSavingsRate ------------------- ------------------ ---------- ------------------------- 12587 31163594 25944826 83
Note

Les valeurs affichées dans la réponse de commande pour les paramètres suivants ne sont pas fiables et vous ne devez pas utiliser ces valeurs : Capacity FreeSpace, UsedSpace, UnoptimizedSize, et SavingsRate.

Résolution des problèmes de déduplication des données

Les problèmes de déduplication des données peuvent avoir plusieurs causes, comme décrit dans la section suivante.

La déduplication des données ne fonctionne pas

Pour connaître l'état actuel de la déduplication des données, exécutez la Get-FSxDedupStatus PowerShell commande pour afficher l'état d'achèvement des tâches de déduplication les plus récentes. Si une ou plusieurs tâches échouent, il est possible que vous ne constatiez aucune augmentation de la capacité de stockage disponible sur votre système de fichiers.

La raison la plus courante de l'échec des tâches de déduplication est le manque de mémoire.

  • Microsoft recommande de disposer de manière optimale de 1 Go de mémoire pour 1 To de données logiques (ou d'un minimum de 350 Mo pour 1 To de données logiques). Utilisez le tableau des performances d'Amazon FSx pour déterminer la mémoire associée à la capacité de débit de votre système de fichiers et vous assurer que les ressources de mémoire sont suffisantes pour la taille de vos données. Si ce n'est pas le cas, vous devez augmenter la capacité de débit du système de fichiers au niveau correspondant aux exigences de mémoire de 1 Go pour 1 To de données logiques.

  • Les tâches de déduplication sont configurées avec l'allocation de mémoire par défaut recommandée par Windows de 25 %, ce qui signifie que pour un système de fichiers doté de 32 Go de mémoire, 8 Go seront disponibles pour la déduplication. L'allocation de mémoire est configurable (à l'aide de la Set-FSxDedupSchedule commande –Memory paramétrée). Sachez que l'utilisation d'une allocation de mémoire plus élevée pour le déduplication peut avoir un impact sur les performances du système de fichiers.

  • Vous pouvez modifier la configuration des tâches de déduplication afin de réduire la quantité de mémoire requise. Par exemple, vous pouvez limiter l'optimisation pour qu'elle s'exécute sur des types de fichiers ou des dossiers spécifiques, ou définir une taille et un âge de fichier minimaux pour l'optimisation. Nous recommandons également de configurer les tâches de déduplication pour qu'elles s'exécutent pendant les périodes d'inactivité lorsque la charge de votre système de fichiers est minimale.

Des erreurs peuvent également s'afficher si les tâches de déduplication ne sont pas terminées suffisamment longtemps. Vous devrez peut-être modifier la durée maximale des tâches, comme décrit dansModification d'un calendrier de déduplication des données.

Si les tâches de déduplication échouent depuis longtemps et que des modifications ont été apportées aux données du système de fichiers au cours de cette période, les tâches de déduplication suivantes peuvent nécessiter davantage de ressources pour être exécutées correctement pour la première fois.

Les valeurs de déduplication sont définies de manière inattendue sur 0

Les valeurs pour SavedSpace et OptimizedFilesSavingsRate sont étonnamment égales à 0 pour un système de fichiers sur lequel vous avez configuré la déduplication des données.

Cela peut se produire pendant le processus d'optimisation du stockage lorsque vous augmentez la capacité de stockage du système de fichiers. Lorsque vous augmentez la capacité de stockage d'un système de fichiers, Amazon FSx annule les tâches de déduplication de données existantes pendant le processus d'optimisation du stockage, qui fait migrer les données des anciens disques vers les nouveaux disques plus grands. Amazon FSx reprend la déduplication des données sur le système de fichiers une fois la tâche d'optimisation du stockage terminée. Pour plus d'informations sur l'augmentation de la capacité de stockage et l'optimisation du stockage, consultezGestion de la capacité de stockage.

L'espace n'est pas libéré sur le système de fichiers après la suppression de fichiers

Le comportement attendu de la déduplication des données est le suivant : si les données supprimées ont permis d'économiser de l'espace, cet espace n'est pas réellement libéré sur votre système de fichiers tant que la tâche de collecte des déchets n'est pas exécutée.

Une pratique qui peut vous être utile consiste à définir le calendrier d'exécution de la tâche de collecte des déchets juste après avoir supprimé un grand nombre de fichiers. Une fois le travail de collecte des ordures terminé, vous pouvez rétablir les paramètres d'origine du calendrier de collecte des déchets. Cela vous permet de voir rapidement et immédiatement l'espace contenu dans vos suppressions.

Utilisez la procédure suivante pour configurer la tâche de collecte des déchets de manière à ce qu'elle s'exécute en 5 minutes.

  1. Pour vérifier que la déduplication des données est activée, utilisez la Get-FSxDedupStatus commande. Pour plus d'informations sur la commande et le résultat attendu, consultezAfficher la quantité d'espace économisé.

  2. Utilisez ce qui suit pour définir le calendrier d'exécution de la tâche de collecte des déchets dans 5 minutes.

    $FiveMinutesFromNowUTC = ((get-date).AddMinutes(5)).ToUniversalTime() $DayOfWeek = $FiveMinutesFromNowUTC.DayOfWeek $Time = $FiveMinutesFromNowUTC.ToString("HH:mm") Invoke-Command -ComputerName ${RPS_ENDPOINT} -ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "WeeklyGarbageCollection" -Days $Using:DayOfWeek -Start $Using:Time -DurationHours 9 }
  3. Une fois que le travail de collecte des ordures est terminé et que l'espace a été libéré, redéfinissez le calendrier à ses paramètres d'origine.