FSx for Windows File Server でのストレージの管理 - Amazon FSx for Windows File Server

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

FSx for Windows File Server でのストレージの管理

ファイルシステムのストレージ設定には、プロビジョニングされたストレージ容量、ストレージタイプ、ストレージタイプがソリッドステートドライブ (SSD) の場合は SSD IOPS の量が含まれます。これらのリソースは、ファイルシステムの作成時と作成後に、ファイルシステムのスループットキャパシティとともに設定して、ワークロードに必要なパフォーマンスを実現できます。、、および でのリモート管理用の Amazon FSx CLI を使用して AWS Management Consoleファイルシステムのストレージとストレージ関連のパフォーマンスを管理する方法については AWS CLI、以下のトピック PowerShell を参照してください。

ストレージコストの最適化

FSx for Windows で利用可能なストレージ設定オプションを使用して、ストレージコストを最適化できます。

ストレージタイプオプション — FSx for Windows File Server には、ハードディスクドライブ (HDD) とソリッドステートドライブ (SSD) の 2 つのストレージタイプが用意されており、ワークロードのニーズに合わせてコスト/パフォーマンスを最適化できます。HDD ストレージは、ホームディレクトリ、ユーザーと部門の共有、コンテンツ管理システムなど、幅広いワークロード向けに設計されています。SSD ストレージは、データベース、メディア処理ワークロード、データ分析アプリケーションなど、最もパフォーマンスが高く、レイテンシーの影響を受けやすいワークロード向けに設計されています。ストレージタイプとファイルシステムのパフォーマンスの詳細については、「」を参照してくださいFSx for Windows File Server のパフォーマンス

データ重複排除 — 大規模なデータセットには冗長なデータが含まれることが多く、データストレージのコストが増加します。例えば、ユーザーのファイル共有には、複数のユーザーによって保存された同じファイルのコピーが複数存在する場合があります。ソフトウェア開発共有には、ビルドごとに変更されないままの多くのバイナリを含めることができます。ファイルシステムの データ重複排除 を有効にすることで、データストレージのコストを削減することができます。重複排除機能を有効にすると、データセットの重複した部分を一度だけ保存することで、冗長データを自動的に削減または排除します。データ重複排除の詳細、および Amazon FSx ファイルシステムで簡単にそれを有効にする方法については、「データ重複排除によるストレージコストの削減」を参照してください。

ストレージ容量の管理

ストレージ要件の変化に応じて、FSx for Windows ファイルシステムのストレージ容量を増やすことができます。これを行うには、Amazon FSx コンソール、Amazon FSx API、または AWS Command Line Interface (AWS CLI) を使用します。ストレージ容量の増加を計画する際に考慮すべき要因には、ストレージ容量を増やす必要があるタイミングを把握する、Amazon FSx がストレージ容量の増加を処理する方法を理解する、ストレージの増加リクエストの進行状況を追跡するなどがあります。ファイルシステムのストレージ容量は増やすことができ、ストレージ容量を減らすことはできません。

注記

2019 年 6 月 23 日より前に作成されたファイルシステムや、2019 年 6 月 23 日より前に作成されたファイルシステムに属するバックアップから復元されたファイルシステムでは、ストレージ容量を増やすことはできません。

Amazon FSx ファイルシステムのストレージ容量を増やすと、Amazon FSx は裏でファイルシステムに新しい大きなディスクセットを追加します。その後、Amazon FSx は、ストレージ最適化プロセスをバックグラウンドで実行し、古いディスクから新しいディスクにデータを透過的に移行します。ストレージの最適化には数時間から数日かかることがありますが、ワークロードのパフォーマンスに及ぼす影響は最小限です。この最適化では、古いストレージボリュームと新しいストレージボリュームの両方がファイルシステムレベルのバックアップに含まれるため、バックアップの使用量が一時的に高くなります。両方のストレージボリュームのセットが含まれているので、ストレージの拡張作業中にも Amazon FSx がバックアップを正常に取得して復元することができます。以前のストレージボリュームがバックアップ履歴に含まれていない場合、バックアップの使用量は、以前のベースラインレベルに戻ります。新しいストレージ容量が利用可能になると、新しいストレージ容量に対してのみ請求されます。

次の図は、Amazon FSx がファイルシステムのストレージ容量を増やすときに使用するプロセスの、4 つの主要ステップを示しています。

4 つのステップを示す図: 1。ストレージ容量増リクエスト、2。FSx は、新しい大きなディスクを追加します、3. FSx はデータを移行します、そして 4. FSx は古いディスクを削除します。

Amazon FSx コンソール、CLI、または API を使用して、ストレージ最適化、SSD ストレージ容量の増加、SSD IOPS の更新の進捗状況をいつでも追跡できます。詳細については、「ストレージ容量の拡張をモニタリングする」を参照してください。

ファイルシステムのストレージ容量の増加について知っておくべきこと

ストレージ容量を増やすときに考慮すべき重要な事項をいくつか挙げます。

  • 増加のみ - ファイルシステムのストレージ容量は増加することのみ可能で、ストレージ容量は減らせません。

  • 増加最小値 - 各ストレージ容量の増加は、ファイルシステムの現在のストレージ容量の最低 10% で、最大許容値 65,536 GiB までである必要があります。

  • 最小スループットキャパシティ - ストレージ容量を増やすには、ファイルシステムの最小スループットキャパシティが 16 MB / 秒である必要があります。これは、ストレージの最適化ステップがスループットを大量に消費するプロセスであるためです。

  • 拡張するまでの時間 - 最後の拡張がリクエストされてから 6 時間経過するか、ストレージの最適化プロセスが完了するか、どちらが長い方は終わるまでは、ファイルシステムのストレージ容量をさらに増やすことはできません。ストレージの最適化には数時間から数日かかります。ストレージの最適化が完了するまでの時間を最小限に抑えるには、ストレージ容量を増やす前にファイルシステムのスループットキャパシティを増やし (ストレージのスケーリング完了後にスループットキャパシティは元に戻せます)、ファイルシステムのトラフィックが最小である場合はストレージ容量を増やすことをお勧めします。

注記

特定のファイルシステムイベントは、次の例のように、ディスク I/O のパフォーマンスリソースを消費する可能性があります。

ストレージ容量のスケーリングの最適化フェーズでは、ディスクスループットが向上し、パフォーマンス警告が発生する可能性があります。詳細については、「パフォーマンスの警告と推奨事項」を参照してください。

ストレージ容量を増やすタイミングを知る

空きストレージ容量が不足している場合は、ファイルシステムのストレージ容量を増やします。FreeStorageCapacity CloudWatch メトリクスを使用して、ファイルシステムで使用可能な空きストレージの量をモニタリングします。このメトリクスで Amazon CloudWatch アラームを作成し、特定のしきい値を下回ると通知を受け取ることができます。詳細については、「Amazon によるモニタリング CloudWatch」を参照してください。

ファイルシステムには、少なくとも 10% の空きストレージ容量を常に維持することをお勧めします。ストレージ容量をすべて使用するとパフォーマンスに悪影響が生じ、データの不整合が生じる可能性があります。

空きストレージ容量が定義済みしきい値を下回った際にファイルシステムのストレージ容量を自動的に増やすことができます。 AWSが開発したカスタム AWS CloudFormation テンプレートを使用して、自動化ソリューションの実装に必要なすべてのコンポーネントをデプロイします。詳細については、「ストレージ容量を動的に増やす」を参照してください。

ストレージ容量の拡張とファイルシステムのパフォーマンス

ほとんどのワークロードでは、パフォーマンスへの影響は最小限に抑えられますが、Amazon FSx は新しいストレージ容量が利用可能になった後、バックグラウンドでストレージ最適化プロセスを実行します。大規模なアクティブデータセットを使用する書き込みの多いアプリケーションでは、一時的に書き込みパフォーマンスが最大で半分に低下する可能性があります。このような場合には、ストレージ容量を増やす 前に、まずファイルシステムのスループットキャパシティを増やすことができます。これにより、アプリケーションのパフォーマンスニーズを満たすために、同じレベルのスループットを提供し続けることができます。詳細については、「FSx for Windows File Server ファイルシステムのスループットキャパシティの管理」を参照してください。

FSx for Windows ファイルシステムのストレージタイプの管理

AWS Management Console および を使用して、ファイルシステムのストレージタイプを HDD から SSD に変更できます AWS CLI。ストレージタイプを SSD に変更する場合、最後の更新がリクエストされてから 6 時間後、またはストレージ最適化プロセスが完了するまで、どちらか長い方までファイルシステム設定を再度更新できないことに注意してください。ストレージの最適化には数時間から数日かかります。この時間を最小限に抑えるために、ファイルシステムのトラフィックが最小のときにストレージタイプを更新することをお勧めします。詳細については、「FSx for Windows ファイルシステムのストレージタイプの更新」を参照してください。

ファイルシステムのストレージタイプは SSD から HDD には変更できません。ファイルシステムのストレージタイプを HDD から SSD に変更する場合は、HDD ストレージを使用するように設定した新しいファイルシステムにファイルシステムのバックアップを復元する必要があります。詳細については、「新しいファイルシステムへのバックアップの復元」を参照してください。

ストレージタイプについて

FSx for Windows File Server ファイルシステムは、ソリッドステートドライブ (SSD) またはマグネティックハードディスクドライブ (HDD) ストレージタイプを使用するように設定できます。

SSD ストレージは、高いパフォーマンス要件とレイシンシーセンシティブを持つほとんどのプロダクション ワークロードに適します。これらのワークロードの例としては、データベース、データ分析、メディア処理、ビジネスアプリケーションなどがあります。また、多数のエンドユーザー、高レベルの I/O、またはデータセットに多数の小さなファイルが含まれるユースケースには、SSD をお勧めします。最後に、シャドウコピーを有効にする場合は SSD ストレージの使用をお勧めします。SSD ストレージを使用するファイルシステムの SSD IOPS は構成およびスケールできますが、HDD ストレージでは構成およびスケールできません。

HDD ストレージは、ホームディレクトリ、ユーザーおよび部門のファイル共有、コンテンツ管理システムなど、幅広いワークロード向けに設計されています。HDD ストレージは SSD ストレージに比べて低コストですが、レイテンシーが高く、ストレージ単位あたりのディスクスループットとディスク IOPS のレベルが低くなります。I/O 要件の低い汎用のユーザー共有やホームディレクトリ、データの取得頻度が低い大規模なコンテンツ管理システム (CMS)、またはサイズの大きいファイルの数が少ないデータセットに適する場合があります。

詳細については、「ストレージ構成とパフォーマンス」を参照してください。

SSD IOPS の管理

SSD ストレージで設定されたファイルシステムの場合、SSD IOPS の量は、キャッシュ内のデータではなく、ファイルシステムがディスクとの間でデータを読み書きする必要があるときに使用可能なディスク I/O の量を決定します。SSD IOPS の量は、ストレージ容量とは無関係に選択およびスケーリングできます。プロビジョニングできる最大 SSD IOPS は、ファイルシステムに選択したストレージ容量とスループットキャパシティによって異なります。SSD IOPS をスループットキャパシティでサポートされている制限を超えて増やそうとすると、そのレベルの SSD IOPS を取得するためにスループットキャパシティを増やす必要がある場合があります。詳細については、「FSx for Windows File Server のパフォーマンス」および「FSx for Windows File Server ファイルシステムのスループットキャパシティの管理」を参照してください。

ファイルシステムのプロビジョンド SSD IOPS の更新について知っておくべき重要な項目を以下に示します。

  • IOPS モードの選択 – 次の 2 つの IOPS モードから選択できます。

    • 自動 – このモードを選択すると、Amazon FSx は SSD IOPS を自動的にスケーリングして、ストレージ容量の GiB あたり 3 SSD IOPS、ファイルシステムあたり最大 400,000 SSD IOPS を維持します。

    • ユーザープロビジョニング – このモードを選択すると、96~400,000 の範囲内の SSD IOPS の数を指定できます。Amazon FSx AWS リージョン が利用可能なすべての のストレージ容量 1 GiB あたり 3~50 IOPS、または米国東部 (バージニア北部)、米国西部 (オレゴン)、米国東部 (オハイオ)、欧州 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (シンガポール) のストレージ容量 1 GiB あたり 3~500 IOPS の数を指定します。ユーザープロビジョニングモードを選択し、指定した SSD IOPS の量が GiB あたり 3 IOPS 以下の場合、リクエストは失敗します。プロビジョニングされた SSD IOPS のレベルが高い場合は、ファイルシステムごとに GiB あたり 3 IOPS を超える平均 IOPS に対して料金が発生します。

  • ストレージ容量の更新 – ファイルシステムのストレージ容量を増やし、デフォルトで現在のユーザープロビジョニング SSD IOPS レベルよりも大きい SSD IOPS 量が必要な場合、Amazon FSx は自動的にファイルシステムを自動モードに切り替え、ファイルシステムのストレージ容量の GiB あたり最低 3 SSD IOPS になります。

  • スループットキャパシティの更新 – スループットキャパシティを増やし、新しいスループット容量でサポートされる最大 SSD IOPS がユーザープロビジョニングの SSD IOPS レベルよりも高い場合、Amazon FSx は自動的にファイルシステムを自動モードに切り替えます。

  • SSD IOPS の増加頻度 – 前回の増加がリクエストされてから 6 時間後、またはストレージ最適化プロセスが完了するまで、どちらか長い方まで、ファイルシステムで SSD IOPS の増加、スループットキャパシティの増加、またはストレージタイプの更新を行うことはできません。ストレージの最適化には数時間から数日かかります。ストレージの最適化が完了するまでの時間を最小限に抑えるために、ファイルシステムのトラフィックが最小限のときに SSD IOPS をスケーリングすることをお勧めします。

注記

4,608 MBps 以上のスループットキャパシティレベルは、 AWS リージョン米国東部 (バージニア北部)、米国西部 (オレゴン)、米国東部 (オハイオ)、欧州 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (シンガポール) の でのみサポートされることに注意してください。

FSx for Windows File Server ファイルシステムのプロビジョニングされた SSD IOPS の量を更新する方法の詳細については、「」を参照してくださいファイルシステムの SSD IOPS の更新

データ重複排除によるストレージコストの削減

データ重複排除は、多くの場合 Dedup for short と呼ばれ、ストレージ管理者が重複データに関連するコストを削減するのに役立ちます。FSx for Windows File Server を使用すると、Microsoft Data Deduplication を使用して冗長データを識別して排除できます。大規模なデータセットは冗長なデータを持つことが多く、データストレージのコストが増加します。例:

  • ユーザーファイル共有には、同じファイルまたは類似のファイルの多数のコピーが含まれる場合があります。

  • ソフトウェア開発共有には、ビルドごとに変更されないバイナリが多数あります。

ファイルシステムのデータ重複排除を有効にすることで、データストレージコストを削減できます。データ重複除外 はデータセットの重複した部分を 1 回のみ保存することで、冗長データを削減または排除します。データ重複排除を有効にすると、データ圧縮はデフォルトで有効になり、重複排除後にデータを圧縮してさらに節約できます。データ重複排除は、データの忠実度や整合性を損なうことなく、冗長性を最適化します。データ重複除外は、ファイルシステムを継続的に自動的にスキャンして最適化するバックグラウンドプロセスとして実行され、ユーザーや接続されたクライアントに対して透過的に実行されます。

データ重複除外によって達成できるストレージの節約は、ファイル間で重複する量など、データセットの性質によって異なります。一般的な汎用ファイル共有では、平均 50~60% 削減されます。共有内では、ユーザードキュメントの 30~50% からソフトウェア開発データセットの 70~80% が節約範囲です。重複排除の潜在的な節約は、以下で説明するMeasure-FSxDedupFileMetadataリモート PowerShell コマンドを使用して測定できます。

また、特定のストレージニーズに合わせてデータ重複除外をカスタマイズすることもできます。例えば、特定のファイルタイプでのみ実行するように重複除外を設定したり、カスタムジョブスケジュールを作成したりできます。重複除外ジョブはファイルサーバリソースを消費することがあるため、以下に説明する Get-FSxDedupStatus コマンドを使用して重複除外ジョブのステータスをモニタリングすることをお勧めします。

データ重複除外の詳細については、Microsoft の「データ重複除外について」ドキュメントを参照してください。

注記

データ重複排除を使用する際のベストプラクティス」のベストプラクティスを参照してください。データ重複除外ジョブが正常に実行されず、問題が発生した場合は、「データ重複排除のトラブルシューティング」を参照してください。

警告

特定の Robocopy コマンドをデータ重複除外で実行することは推奨されません。これらのコマンドはチャンクストアのデータ整合性に影響を与える可能性があるためです。詳細については、Microsoft のデータ重複除外の相互運用性に関するドキュメントを参照してください。

データ重複排除を使用する際のベストプラクティス

ここでは、Data Deduplication を使用するためのいくつかのベストプラクティスを以下に示します。

  • ファイルシステムがアイドル状態のときに実行するように Data Deduplication ジョブをスケジュールする: デフォルトのスケジュールには、毎週土曜日の 2:45 UTC に実行される GarbageCollection ジョブが含まれています。ファイルシステムで大量のデータが流出している場合、完了するまでに数時間かかることがあります。この時間がワークロードにとって理想的でない場合は、ファイルシステムのトラフィックが少ないと予想される時間にこのジョブを実行するようにスケジュールします。

  • Data Deduplication を完了するのに十分なスループットキャパシティを設定する: スループットキャパシティが大きいほど、メモリのレベルが高くなります。Microsoft では、Data Deduplication を実行するには、論理データの 1 TB あたり 1 GB のメモリを用意することを推奨します。Amazon FSx パフォーマンステーブルを使用して、ファイルシステムのスループットキャパシティに関連付けられているメモリを特定し、メモリリソースがデータのサイズに対して十分であることを確認します。

  • Data Deduplication の設定をカスタマイズして、特定のストレージのニーズを満たし、パフォーマンス要件を緩和する: 特定のファイルタイプまたはフォルダーで実行するように最適化を制限したり、最適化のための最小ファイルサイズと経過時間を設定したりできます。詳細については、「データ重複排除によるストレージコストの削減」を参照してください。

データ重複除外の管理

でのリモート管理に Amazon FSx CLI を使用して、ファイルシステムのデータ重複排除を管理できます PowerShell。での Amazon FSx CLI リモート管理の使用の詳細については PowerShell、「」を参照してくださいでの Amazon FSx CLI の使用 PowerShell

データ重複除外に使用できるコマンドは次のとおりです。

データ重複除外コマンド 説明

Enable-FSxDedup

ファイル共有でデータ重複除外を有効にします。データ重複除外を有効にすると、重複除外後のデータ圧縮がデフォルトで有効になります。

Disable-FSxDedup

ファイル共有のデータ重複除外を無効にします。

Get-FSxDedupConfiguration

最適化の最小ファイルサイズと保存期間、圧縮設定、除外されたファイルタイプとフォルダなど、重複除外設定情報を取得します。

Set-FSxDedupConfiguration

最適化の最小ファイルサイズと保存期間、圧縮設定、除外されたファイルタイプとフォルダなど、重複除外の設定を変更します。

Get-FSxDedupStatus

重複排除ステータスを取得し、ファイルシステムの最適化の節約とステータス、時間、ファイルシステム上の最後の重複排除ジョブの完了ステータスを記述する読み取り専用プロパティを含めます。

Get-FSxDedupMetadata

重複除外最適化メタデータを取得します。

Update-FSxDedupStatus

更新されたデータ重複除外の節約情報を計算して取得します。

Measure-FSxDedupFileMetadata

フォルダのグループを削除した場合に、ファイルシステム上で再利用できる潜在的なストレージ領域を測定および取得します。多くの場合、ファイルには他のフォルダ間で共有されるチャンクがあり、重複除外エンジンは一意で削除されるチャンクを計算します。

Get-FSxDedupSchedule

現在定義されている重複除外スケジュールを取得します。

New-FSxDedupSchedule

データ重複排除スケジュールを作成してカスタマイズします。

Set-FSxDedupSchedule

既存のデータ重複除外スケジュールの設定を変更します。

Remove-FSxDedupSchedule

重複排除スケジュールを削除します。

Get-FSxDedupJob

現在実行中またはキューに入っているすべての重複排除ジョブのステータスと情報を取得します。

Stop-FSxDedupJob

指定したデータ重複除外ジョブを 1 つ以上キャンセルします。

各コマンドのオンラインヘルプには、すべてのコマンドオプションのリファレンスが記載されています。このヘルプにアクセスするには、-? (例えば、Enable-FSxDedup -?) コマンドを実行します。

データ重複除外の有効化

Amazon FSx for Windows File Server ファイル共有でデータ重複除外を有効にするには、次のように Enable-FSxDedup コマンドを使用します。

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Enable-FsxDedup }

データ重複除外を有効にすると、デフォルトのスケジュールと設定が作成されます。以下のコマンドを使用して、スケジュールと設定を作成、変更、削除できます。

Disable-FSxDedup コマンドを使用して、ファイルシステムのデータ重複除外を完全に無効化できます。

データ重複除外スケジュールの作成

デフォルトのスケジュールはほとんどの場合うまく機能しますが、次のように New-FsxDedupSchedule コマンドを使用して、新しい重複除外スケジュールを作成することができます。データ重複除外スケジュールでは UTC 時間が使用されます。

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock { New-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Wed,Sat -Start 08:00 -DurationHours 7 }

このコマンドは CustomOptimization という名前のスケジュールを作成します。これは、月曜日、水曜日、土曜日に実行され、毎日午前 8:00 (UTC) にジョブを開始し、最大期間は 7 時間で、ジョブがまだ実行されている場合はジョブを停止します。

新しいカスタム重複除外ジョブスケジュールを作成しても、既存のデフォルトスケジュールが上書きされたり、削除されたりすることはありません。デフォルトのジョブが不要な場合は、カスタム重複除外ジョブを作成する前に無効にすることができます。

以下に示すように、Set-FsxDedupSchedule コマンドを使用して、デフォルトの重複除外付けジュールを無効化できます。

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Set-FSxDedupSchedule -Name “BackgroundOptimization” -Enabled $false}

重複排除スケジュールは、Remove-FSxDedupSchedule -Name "ScheduleName" コマンドを使用して削除できます。デフォルトの BackgroundOptimization 重複排除スケジュールは変更または削除できないため、無効にする必要があります。

データ重複除外スケジュールの変更

次のように Set-FsxDedupSchedule コマンドを使用して、既存の重複除外スケジュールを変更できます。

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Tues,Wed,Sat -Start 09:00 -DurationHours 9 }

このコマンドは、既存の CustomOptimization スケジュールを修正します。これは、月曜日から水曜日と土曜日の日に実行され、毎日午前 9:00 (UTC) にジョブを開始し、最大期間は 9 時間で、ジョブがまだ実行されている場合はジョブを停止します。

最適化前のファイルの最小保存期間を変更するには、Set-FSxDedupConfiguration コマンドを使用します。

保存スペースの量の表示

データ重複除外を実行することで節約するディスク容量を表示するには、次のように Get-FSxDedupStatus コマンドを使用します。

PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FsxRemoteAdmin -ScriptBlock { Get-FSxDedupStatus } | select OptimizedFilesCount,OptimizedFilesSize,SavedSpace,OptimizedFilesSavingsRate OptimizedFilesCount OptimizedFilesSize SavedSpace OptimizedFilesSavingsRate ------------------- ------------------ ---------- ------------------------- 12587 31163594 25944826 83
注記

次のパラメータのコマンドレスポンスに表示される値は信頼性がないため、容量、 FreeSpace UsedSpace、 UnoptimizedSize、および の値を使用しないでください SavingsRate。

データ重複排除のトラブルシューティング

次のセクションで説明するように、データ重複排除の問題にはいくつかの潜在的な原因があります。

データ重複排除が機能していない

データ重複排除の現在のステータスを確認するには、 Get-FSxDedupStatus PowerShell コマンドを実行して、最新の重複排除ジョブの完了ステータスを表示します。1 つ以上のジョブが失敗している場合、ファイルシステム上で空きストレージ容量の増加が見られない場合があります。

重複排除ジョブが失敗する最も一般的な理由は、メモリ不足です。

  • Microsoft では、論理データ 1 TB あたり 1 GB のメモリ (または論理データ 1 TB あたり 350 MB 以上) を最適に使用することを推奨しています。Amazon FSx パフォーマンステーブル を使用して、ファイルシステムのスループットキャパシティに関連付けられているメモリを特定し、メモリリソースがデータのサイズに対して十分であることを確認します。そうでない場合は、ファイルシステムのスループット容量を、論理データの 1 TB あたり 1 GB のメモリ要件を満たすレベルまで増やす必要があります。

  • 重複排除ジョブは、Windows が推奨するデフォルトの 25% のメモリ割り当てで設定されます。つまり、32 GB のメモリを備えたファイルシステムの場合、8 GB が重複排除に使用できます。メモリ割り当ては設定可能です (パラメータ を指定して Set-FSxDedupSchedule コマンドを使用します–Memory)。重複排除により高いメモリ割り当てを使用すると、ファイルシステムのパフォーマンスに影響する可能性があることに注意してください。

  • 重複排除ジョブの設定を変更して、必要なメモリ量を減らすことができます。例えば、特定のファイルタイプまたはフォルダーで実行するように最適化を制限したり、最適化のための最小ファイルサイズと経過時間を設定したりできます。また、ファイルシステムのロードが最小限であるアイドル期間中に重複排除ジョブが実行されるように設定することをお勧めします。

重複排除ジョブを完了するのに十分な時間がない場合にも、エラーが表示されることがあります。データ重複除外スケジュールの変更 で説明されているように、ジョブの最大期間を変更する必要がある場合があります。

重複排除ジョブが長期間失敗していて、この期間中にファイルシステム上のデータに変更があった場合、後続の重複排除ジョブを初めて正常に完了するには、より多くのリソースが必要になる場合があります。

重複排除の値が予期せず 0 に設定されている

データ重複排除を設定したファイルシステムでは、SavedSpaceOptimizedFilesSavingsRate の値が予期せず 0 になります。

これは、ファイルシステムのストレージ容量を増やす際、ストレージ最適化プロセス中に発生する可能性があります。ファイルシステムのストレージ容量を増やすと、Amazon FSx は、ストレージ最適化プロセス中に既存のデータ重複排除ジョブをキャンセルします。これにより、以前のディスクから新しくより大きなディスクにデータが移行されます。ストレージ最適化ジョブが完了すると、Amazon FSx はファイルシステムでのデータ重複排除を再開します。ストレージ容量の増加とストレージの最適化の詳細については、「ストレージ容量の管理」を参照してください。

ファイルを削除した後、ファイルシステムのスペースが解放されません

データ重複排除の予想される動作は、重複排除がスペースを節約したデータが削除されたデータであった場合、ガベージコレクションのジョブが実行されるまでファイルシステムでスペースは解放されません。

役立つと思われるプラクティスとして、多数のファイルを削除した直後にガベージコレクションのジョブを実行するようにスケジュールを設定することができます。ガベージコレクションのジョブが終了したら、ガベージコレクションのスケジュールを元の設定に戻すことができます。これにより、削除により解放された容量をすぐに確認できます。

次の手順を使用して、ガベージコレクションジョブを 5 分で実行するように設定します。

  1. データ重複排除が有効になっていることを確認するには、Get-FSxDedupStatus コマンドを使用します。コマンドとその期待される出力の詳細については、「保存スペースの量の表示」を参照してください。

  2. 以下を使用して、5 分後にガベージコレクションのジョブを実行するスケジュールを設定します。

    $FiveMinutesFromNowUTC = ((get-date).AddMinutes(5)).ToUniversalTime() $DayOfWeek = $FiveMinutesFromNowUTC.DayOfWeek $Time = $FiveMinutesFromNowUTC.ToString("HH:mm") Invoke-Command -ComputerName ${RPS_ENDPOINT} -ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "WeeklyGarbageCollection" -Days $Using:DayOfWeek -Start $Using:Time -DurationHours 9 }
  3. ガベージコレクションのジョブが実行され、スペースが解放されたら、スケジュールを元の設定に戻します。