AWS DataSyncを使用して、既存のファイルを FSx for Windows File Server に移行する - Amazon FSx for Windows File Server

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS DataSyncを使用して、既存のファイルを FSx for Windows File Server に移行する

AWS DataSync を使用して FSx for Windows File Server ファイルシステム間でデータを転送することをお勧めします。 DataSync は、オンプレミスストレージシステムと他の AWS ストレージサービス間のデータの移動とレプリケーションをインターネット経由で簡素化、自動化、高速化するデータ転送サービスです AWS Direct Connect。 DataSync は、所有権、タイムスタンプ、アクセス許可などのファイルシステムデータとメタデータを転送できます。

DataSync は、NTFS アクセスコントロールリスト (ACLsのコピーをサポートし、NTFS システムアクセスコントロールリスト (SACLsは、管理者がファイルへのアクセスを試みたときの監査ログ記録を制御するために使用されます。

DataSync を使用して 2 つの FSx for Windows File Server ファイルシステム間でファイルを転送したり、別の AWS リージョン または AWS アカウントのファイルシステムにデータを移動したりできます。 DataSync FSx for Windows File Server ファイルシステムで を他のタスクに使用できます。例えば、一度限りのデータ移行、配信ワークロード用の定期的なデータ取り込み、およびデータ保護と回復のためのレプリケーションを計画できます。

では AWS DataSync、FSx for Windows File Server の場所は FSx for Windows File Server のエンドポイントです。FSx for Windows File Server のロケーションと他のファイルシステムのロケーションとの間でファイルを転送できます。詳細については、「AWS DataSync ユーザーガイド」の「ロケーションの使用」を参照してください。

DataSync は、サーバーメッセージブロック (SMB) プロトコルを使用して FSx for Windows File Server にアクセスします。 AWS DataSync コンソールまたは で設定したユーザー名とパスワードで認証されます AWS CLI。

前提条件

Amazon FSx for Windows File Server のセットアップにデータを移行するには、要件を満たすサーバーとネットワークが必要です DataSync 。詳細については、「 ユーザーガイド」の DataSync「 の要件AWS DataSync 」を参照してください。

大規模なデータ移行、または多数の小さなファイルを含む移行を行う場合は、SSD ストレージタイプの Amazon FSx ファイルシステムを使用することをお勧めします。これは、 DataSync タスクにはファイルメタデータのスキャンが含まれるため、HDD ファイルシステムのディスク IOPS 制限が枯渇し、移行が長くなり、ファイルシステムのパフォーマンスに影響が及ぶ可能性があるためです。詳細については、「既存のファイルストレージを FSx for Windows File Server に移行するためのベストプラクティス」を参照してください。

データセットがほとんど小さなファイルで構成されている場合、数百万のファイル数の場合、または消費するよりも 1 つの DataSync タスクよりも利用可能なネットワーク帯域幅がある場合は、スケールアウトアーキテクチャでデータ転送を高速化することもできます。詳細については、AWS DataSync 「スケールアウトアーキテクチャを使用してデータ転送を高速化する方法」を参照してください。

FSx パフォーマンスメトリクスを使用して、ファイルシステムのディスク I/O 使用状況をモニタリングできます。

を使用してファイルを移行するための基本的な手順 DataSync

を使用してソースの場所から宛先にファイルを転送するには DataSync、以下の基本的なステップを実行します。

  • ご使用の環境にエージェントをダウンロードしてデプロイし、アクティブ化します。

  • ソースと宛先の場所を作成して設定します。

  • タスクを作成し、設定します。

  • タスクを実行して、ソースから宛先にファイルを転送します。

既存のオンプレミスファイルシステムから FSx for Windows File Server にファイルを転送する方法については、 AWS DataSync ユーザーガイド「セルフマネージドストレージと 間のデータ転送 AWS」、「SMB の場所の作成」、「Amazon FSx for Windows File Server の場所の作成」を参照してください。

既存のクラウド内ファイルシステムから FSx for Windows File Server にファイルを転送する方法については、「AWS DataSync ユーザーガイド」の「Deploy your agent as an Amazon EC2 instance」 (Amazon EC2 インスタンスとしてエージェントをデプロイする) を参照してください。

2 つの Amazon FSx ファイルシステム間の移行

を使用して DataSync 、2 つの Amazon FSx ファイルシステム間でデータを移行できます。これは、既存のファイルシステムから、シングル AZ 設定からマルチ AZ 設定など、異なる設定の新しいファイルシステムにワークロードを移動する必要がある場合に役立ちます。を使用して DataSync 、ワークロードを 2 つのファイルシステム間で分割することもできます。

移行プロセスの概要の例を次に示します。

  1. ソースファイルシステムとデスティネーションファイルシステム DataSync の場所を作成します。ソースとターゲットの両方が同じ Active Directory ドメインに属しているか、ドメイン間の AD 信頼関係を持っている必要があることに注意してください。

  2. ソースから宛先にデータを転送する DataSync タスクを作成して設定します。1 回限りのインスタンスとしてタスクを実行することも、設定したスケジュールに従って自動的に実行するようにタスクを設定することもできます。

  3. タスクが正常に完了すると、ターゲットファイルシステムのデータはソースの正確なコピーになります。タスクを完了するには、ソースファイルシステム上の書き込みアクティビティまたはファイル更新を一時的に停止する必要があることに注意してください。その後、ターゲットファイルシステムにカットオーバーし、ソースファイルシステムを削除できます。

本番稼働用環境のファイルシステムから移行する前に、最新のバックアップから復元されたファイルシステムで移行プロセスをテストできます。これにより、データ転送プロセスにかかる時間を見積もり、 DataSync エラーを事前にトラブルシューティングできます。

カットオーバー時間を最小限に抑えるために、 DataSync タスクを事前に実行し、データの大部分をソースファイルシステムから宛先ファイルシステムに移動できます。ソースファイルシステムへのトラフィックを停止したら、最後のタスク転送を実行して、トラフィックを停止した後に新しく更新されたデータを同期し、ターゲットファイルシステムにカットオーバーできます。

特定のディレクトリでのみ実行するタスク、または特定のパスを含めるか除外するように DataSync タスクを設定できます。これは、複数のタスクを並列実行している場合や、データのサブセットを移行する場合に便利です。

ソースファイルシステムの DNS 名と同じ DNS エイリアスをターゲットファイルシステムに作成できます。これにより、エンドユーザーとアプリケーションは、ソースファイルシステムの DNS 名を使用してファイルデータに引き続きアクセスできます。DNS エイリアスの設定方法の詳細については、「チュートリアル 5: DNS エイリアスを使用してファイルシステムにアクセスする」を参照してください。

このタイプの移行を実行する場合、次のことをお勧めします。

  • ファイルシステムのバックアップ、毎週のメンテナンスウィンドウ、および Data Deduplication ジョブを回避するように移行をスケジュールします。具体的には、計画された移行と一致する場合は、Data Deduplication GarbageCollection ジョブを無効にすることをお勧めします。

  • ソースとターゲットのファイルシステムの両方に SSD ストレージタイプを使用します。バックアップから復元することで、HDD と SSD のストレージタイプを切り替えることができます。詳細については、「FSx for Windows File Server に既存のファイルストレージを移行する」を参照してください。

  • 転送する必要のあるデータ量のために十分なスループットキャパシティがあるように、ソースとターゲットのファイルシステムを設定します。 DataSync タスクプロセス中に、ソースファイルシステムとデスティネーションファイルシステムの両方のパフォーマンス使用率をモニタリングします。詳細については、「Amazon によるメトリクスのモニタリング CloudWatch」を参照してください。

  • 進行中のタスクの進行状況を理解するのに役立つDataSync モニタリングを設定します。また、Amazon CloudWatch Logs グループに DataSync ログを送信して、エラーが発生した場合のタスクのデバッグを支援することもできます。