AWS DataSyncタスク設定を設定する - AWS DataSync

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS DataSyncタスク設定を設定する

AWS DataSync エージェントを作成し、送信元と送信先の場所を設定した後、新しいタスクを設定できます。タスクは、2 つの場所 (送信元と送信先) からなる一式とタスクの動作を制御するために使用する一連のオプションです。

AWS DataSync コンソールで新しいタスクを作成する際に、タスクを設定します。また、https://console.aws.amazon.com/datasync/で AWS DataSync コンソールを開き、編集したいタスクを選択し、編集を選択することで、タスク設定を編集することができます。

設定の構成 ページで、タスク名 (オプション)にタスクの名前を入力します。タスク名 は任意の設定です。

オプション セクションには、タスクを実行するための設定オプションが含まれています。次のセクションでは、これらのオプションについて詳しく説明します。

データ検証オプション

DataSync データ転送時には、転送中必ずデータ整合性チェックを実行します。追加の検証を有効にして、転送の終了時に送信元と送信先を比較できます。この追加のチェックでは、データセット全体、またはタスク実行の一部として転送されたファイルのみを検証できます。ほとんどのユースケースでは、転送されたファイルのみを検証することをお勧めします。

タスクデータの検証オプションでは、タスクによって転送されるデータの検証方法を指定します。

データ検証オプションは、次のとおりです。

  • [Verify only the data transferred (recommended) (転送されたデータのみ検証する (推奨))] - このオプションは、転送されたファイルと送信元のメタデータのチェックサムを計算します。次に、このチェックサムと、転送の終了時に送信先にあるファイルで計算されたチェックサムを比較します。S3 Glacier FleS3 Glacier Deep Archive Retrieval ストレージクラスに転送する場合は、このオプションをお勧めします。詳細については、「Amazon S3 ロケーションでのストレージクラスに関する考慮事項」を参照してください。

  • [Verify all data in the destination (送信先ですべてのデータを検証する)] - このオプションは、送信元全体と送信先全体の転送の最後にスキャンを実行し、送信元と送信先が完全に同期されていることを確認します。S3 Glacier Fleacier Deep Retrieval または S3 GS3 Glacier Deep Archive Retrieval ストレージクラスに転送する場合は、このオプションを使用できません。詳細については、「Amazon S3 ロケーションでのストレージクラスに関する考慮事項」を参照してください。

  • [Check integrity during the transfer (転送中に整合性をチェックする)] - このオプションは、転送の終了時に追加の検証を実行しません。すべてのデータ転送は、引き続き転送中にチェックサム検証によって整合性がチェックされます。

所有権と許可関連のオプション

DataSync は、類似したメタデータ構造を持つストレージシステム間でメタデータを保持します。ストレージシステムのタイプに応じて、このようなメタデータの保存を設定するには、さまざまなオプションが使用されます。

Amazon S3 と Network File System (NFS)、Hadoop Distributed File System (HDFS)、Amazon EFS、Amazon FSx for Lustre、Amazon FSX for NetApp ONTAP (NFS を使用) の間でデータをコピーする場合は、以下のいずれかを選択します。

  • ファイルの所有者のグループ ID やファイルの所有者のユーザー ID など、POSIX DataSync ファイルやフォルダの所有権をコピーするには、所有権をコピーを選択します。

  • ファイルやフォルダの POSIX DataSync 許可をソースから送信先にコピーするには、許可のコピーを選択します。

サーバーメッセージブロック (SMB) と FSx for Windows File Server または FSx for Windows File Server 間、または FSx for Windows File Server ファイルシステム間、または SMB を使用して FSx for ONTAP ファイルシステム間でコピーする場合は、次のいずれかを選択します。

  • 所有権、DACL、SACL のコピーを選択して、 DataSync 以下をコピーします。

    • オブジェクトの所有者

    • NTFS 任意アクセスリスト (DACL) は、オブジェクトへのアクセスを許可するかどうかを決定します。

    • NTFS システムアクセスコントロールリスト (SACL) は、管理者がセキュリティ保護されたオブジェクトへのアクセス試行を記録するために使用されます。

  • 所有権と DACL のコピーを選択して、 DataSync 以下をコピーします。

    • オブジェクトの所有者

    • NTFS 任意アクセスリスト (DACL) は、オブジェクトへのアクセスを許可するかどうかを決定します。

    DataSync このオプションを選択すると、NTFS システムアクセス制御リスト (SACL) はコピーされません。

  • 所有権または許可のデータをコピーしたくない場合は、所有権または ACL DataSync をコピーしないを選択します。 DataSync 送信先ロケーションに書き込むオブジェクトは、 DataSync 送信先ロケーションにアクセスするための資格情報を提供するユーザーによって所有されます。送信先オブジェクトのアクセス許可は、送信先サーバーで設定されたアクセス許可に基づいて決定されます。

によるメタデータの保存の詳細については DataSync、を参照してくださいAWS DataSyncメタデータおよび特殊ファイルの処理方法。

ファイルメタデータと管理オプション

DataSync 転送中のファイルやオブジェクトの処理方法を設定できます。

  • DataSync タイムスタンプのメタデータをソースからコピー先にコピーするには、タイムスタンプのメタデータをコピーを選択します。

  • DataSync ソースファイルシステムに存在しない送信先に保持するには、削除されたファイルを保持するを選択します。

    タスクが Amazon S3 バケットからオブジェクトを削除した場合、特定のストレージクラスに対して最小ストレージ期間料金が発生する可能性があります。詳細については、「Amazon S3 ロケーションでのストレージクラスに関する考慮事項」を参照してください。

  • ソースのデータやメタデータが異なる場合に、送信先のファイルをソースのファイルで上書きする場合は、ファイルを上書きする を選択します。

    このオプションを選択しない場合、送信先のファイルが送信元のファイルと異なる場合でも、送信先のファイルは送信元のファイルで置き換えられません。

    タスクがオブジェクトを上書きする場合、特定のストレージクラスに対して追加料金が発生する可能性があります (たとえば、取得や早期削除など)。詳細については、「Amazon S3 ロケーションでのストレージクラスに関する考慮事項」を参照してください。

  • オブジェクトストレージシステム間で転送するときに、オブジェクトに関連付けられたタグを保存する場合は、[オブジェクトタグのコピー] を選択します。

帯域幅オプション

DataSync タスクの帯域幅制限を設定できます。帯域幅制限オプションは次のとおりです。

  • DataSync 転送に使用可能なすべてのネットワーク帯域幅を使用するには、使用可能を選択します。

  • 帯域幅制限の設定 (MiB/秒) を選択すると、 DataSync このタスクに使用する最大帯域幅を制限できます。

    進行中のタスク実行の帯域幅制限を変更できます。詳細については、「タスク実行の帯域幅スロットリングの調整」を参照してください。

フィルタリングのオプション

送信元から送信先にデータを転送するときに、フィルターを適用して、送信元でファイルのサブセットのみを転送することができます。フィルタリングの設定オプションは次のとおりです。

  • データ転送設定 セクションでは、除外パターンセクションを使用して、転送対象から除外するファイル、フォルダ、オブジェクトを指定できます。特定のファイル、フォルダ、およびオブジェクトを転送に含めるには、特定のファイルとフォルダインクルードパターン セクションに追加します。

  • フィルターにパターンを追加するには、[Add pattern (パターンを追加)] を選択します。フィルタリングおよびパターン作成の構文の詳細については、「によって転送されるデータのフィルタリングAWS DataSync」を参照してください。

  • タスクを編集するときに、フィルターパターンを変更できます。タスクを実行するたびに異なるパターンを指定することもできます。

スケジューリングおよびキューイングオプション

DataSync タスクが特定の時間に実行されるようにスケジュールできます。1 つのエージェントを使用して複数のタスクを実行する場合は、それらのタスクをキューイングできます。スケジューリングのオプションの設定は次のとおりです。

  • スケジュール(オプション) セクションでは、指定したスケジュールでタスクが実行されるように設定できます(最小間隔は 1 時間)。

  • [Frequency (頻度)] で、タスクを実行する頻度を設定します。周波数設定オプションについては、「タスクスケジュールの設定」を参照してください。

1 つのエージェントで複数のタスクを実行する場合は、Queueing (キューイング) を選択して、タスクを連続して実行します(先入れ先出し)。詳細については、「タスク実行のキューイング」を参照してください。

タグとロギングオプション

DataSync タスクには 1 つ以上のタグを追加できます。タグは、タスクに関連付けられているキーと値のペアです。また、ログオプションを選択して、 DataSync 個々のファイルまたはオブジェクトのログを、 CloudWatch 指定したロググループに発行することもできます。タグとロギングオプションは次のとおりです。

  • タグ」セクションで、「キー」と「」を入力してタスクにタグを付けます。タグは、タスクの管理、フィルタリング、検索に便利なキー値ペアです。タスクの名前タグを作成することが推奨されます。

  • DataSync 個別のファイルまたはオブジェクトのログを、指定したロググループに公開するには、 CloudWatch タスクログを選択します

    CloudWatch ロググループにログをアップロードするには、 DataSync 十分なアクセス許可を付与するリソースポリシーが必要です。現在のリージョンにポリシーがない場合は、チェックボックスが表示され、必要なポリシーを自動的に作成できます。このようなポリシーの例については、「Amazon DataSync CloudWatch ロググループへのログのアップロードを許可する」を参照してください。

    ロググループとストリームの使用の詳細については、Amazon CloudWatch Logs ユーザーガイドロググループとログストリームを操作するを参照してください。

    ログレベルオプションを使用すると、 CloudWatch ログに記録される詳細レベルを設定できます。ログレベルオプションは以下のとおりです。

    • 基本情報(転送エラーなど)のみを公開する場合は、転送エラーなどの基本情報をログ記録するを選択します CloudWatch。

    • タスクがコピーして整合性を確認したすべてのファイルまたはオブジェクトのログレコードを CloudWatch Logs に公開するには、転送されたすべてのオブジェクト、ファイル、およびフォルダをログ記録するを選択します。

    • CloudWatchログの公開先を設定したくない場合は、 DataSync ログを送信しないを選択します CloudWatch。

[] を選択して [Review (確認)] ページを開きます。