タスク設定の構成 - AWS DataSync

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

タスク設定の構成

を作成した後AWS DataSync エージェントと送信元と送信先の場所を設定した場合、新しいタスクを設定できます。タスクは、2 つの場所 (送信元と送信先) からなる一式とタスクの動作を制御するために使用する一連のオプションです。

AWS DataSync コンソールで新しいタスクを作成する際に、タスクを設定します。また、https://console.aws.amazon.com/datasync/で AWS DataSync コンソールを開き、編集したいタスクを選択し、編集を選択することで、タスク設定を編集することができます。

設定の構成 ページで、タスク名 (オプション)にタスクの名前を入力します。タスク名 は任意の設定です。

オプション セクションには、タスクを実行するための設定オプションが含まれています。次のセクションでは、これらのオプションについて詳しく説明します。

データ検証オプション

として DataSync は、データを転送し、転送中必ずデータ整合性チェックを実行します。追加の検証を有効にして、転送の終了時に送信元と送信先を比較できます。この追加のチェックでは、データセット全体、またはタスク実行の一部として転送されたファイルのみを検証できます。ほとんどのユースケースでは、転送されたファイルのみを検証することをお勧めします。

タスクデータの検証オプションでは、タスクによって転送されるデータの検証方法を指定します。

データ検証オプションは、次のとおりです。

  • [Verify only the data transferred (recommended) (転送されたデータのみ検証する (推奨))] - このオプションは、転送されたファイルと送信元のメタデータのチェックサムを計算します。次に、このチェックサムと、転送の終了時に送信先にあるファイルで計算されたチェックサムを比較します。S3 Glacier Flexible Retrieval または S3 Glacier Deep Archive ストレージクラスに転送する場合は、このオプションをお勧めします。詳細については、「DataSync で Amazon S3 ストレージクラスを使用する場合の考慮事項」を参照してください。

  • [Verify all data in the destination (送信先ですべてのデータを検証する)] - このオプションは、送信元全体と送信先全体の転送の最後にスキャンを実行し、送信元と送信先が完全に同期されていることを確認します。S3 Glacier Flexible Retrieval または S3 Glacier Deep Archive ストレージクラスに転送する場合は、このオプションを使用できません。詳細については、「DataSync で Amazon S3 ストレージクラスを使用する場合の考慮事項」を参照してください。

  • [Check integrity during the transfer (転送中に整合性をチェックする)] - このオプションは、転送の終了時に追加の検証を実行しません。すべてのデータ転送は、引き続き転送中にチェックサム検証によって整合性がチェックされます。

所有権と許可関連のオプション

DataSync は、類似したメタデータ構造を持つストレージシステム間でメタデータを保持します。ストレージシステムのタイプに応じて、このようなメタデータの保存を設定するには、さまざまなオプションが使用されます。

ネットワークファイルシステム (NFS)、Hadoop Distributed File System (HDFS)、Amazon EFS、Amazon FSx for Lustre、OpenZFS、Amazon S3 の間でデータをコピーする場合は、以下のいずれかを選択します。

  • 選択所有権のコピーが必須です DataSync ファイルの所有者のグループ ID やファイルの所有者のユーザー ID など、POSIX ファイルとフォルダの所有権をコピーします。

  • 選択権限のコピーが必須です DataSync ファイルやフォルダの POSIX アクセス許可をソースから送信先にコピーします。

サーバーメッセージブロック (SMB) と FSx for Windows File Server、または Windows ファイルサーバーの場合は 2 つの FSx の場所間でコピーする場合は、以下のいずれかを選択します。

  • 選択所有権、DACL、および SACL をコピーするが必須です DataSync 次のものをコピーします。

    • オブジェクトの所有者

    • NTFS 任意アクセスリスト (DACL) は、オブジェクトへのアクセスを許可するかどうかを決定します。

    • NTFS システムアクセスコントロールリスト (SACL) は、管理者がセキュリティ保護されたオブジェクトへのアクセス試行を記録するために使用されます。

    SACL をコピーするには、以下のように Windows ユーザーに追加のアクセス許可を付与する必要があります。 DataSync は、SMB ロケーションにアクセスするために使用します。ファイル、フォルダー、およびメタデータに対する十分な権限を確保するためのユーザー名の選択については、ユーザー を参照してください。

  • 選択所有権と DACL をコピーするが必須です DataSync 次のものをコピーします。

    • オブジェクトの所有者

    • NTFS 任意アクセスリスト (DACL) は、オブジェクトへのアクセスを許可するかどうかを決定します。

    このオプションを選択すると、DataSync は NTFS システムアクセス制御リスト (SACL) をコピーしません。

  • 選択所有権または ACL をコピーしないでください。あなたが望むなら DataSync 所有権や権限のデータをコピーしないでください。そのオブジェクト DataSync 送信先ロケーションへの書き込みは、資格情報を提供するユーザーによって所有されます。 DataSync をクリックして、目的地の場所にアクセスします。送信先オブジェクトのアクセス許可は、送信先サーバーで設定されたアクセス許可に基づいて決定されます。

DataSync を使用したメタデータの保存の詳細については、その方法は DataSync がメタデータおよび特殊ファイルを処理します。

ファイルメタデータオプションとファイル管理

を設定できます。 DataSync タスクでは、ファイルメタデータをコピーし、削除されたファイルを保持し、コピー先のファイルを上書きします。オプション設定は以下のとおりです。

  • 選択タイムスタンプのコピーが必須です DataSync ソースから宛先までタイムスタンプのメタデータをコピーします。

  • 選択削除されたファイルを保持するが必須です DataSync ソースファイルシステムに存在しないファイルを送信先に保持します。

    タスクが Amazon S3 バケットからオブジェクトを削除した場合、特定のストレージクラスに対して最小ストレージ期間料金が発生する可能性があります。詳細については、「DataSync で Amazon S3 ストレージクラスを使用する場合の考慮事項」を参照してください。

  • ソースのデータやメタデータが異なる場合に、送信先のファイルをソースのファイルで上書きする場合は、ファイルを上書きする を選択します。

    このオプションを選択しない場合、送信先のファイルが送信元のファイルと異なる場合でも、送信先のファイルは送信元のファイルで置き換えられません。

    タスクがオブジェクトを上書きする場合、特定のストレージクラスに対して追加料金が発生する可能性があります (たとえば、取得や早期削除など)。詳細については、「DataSync で Amazon S3 ストレージクラスを使用する場合の考慮事項」を参照してください。

帯域幅オプション

の帯域幅制限を設定できます。 DataSync タスク。帯域幅制限オプションは次のとおりです。

  • 選択使用可能が必須です DataSync 転送に使用可能なすべてのネットワーク帯域幅を使用します。

  • 選択帯域幅制限 (MiB/秒) を設定します。必要な最大帯域幅を制限するには DataSync このタスクに使用します。

    進行中のタスク実行の帯域幅制限を変更できます。詳細については、「タスク実行の帯域幅スロットリングの調整」を参照してください。

フィルタリングのオプション

送信元から送信先にデータを転送するときに、フィルターを適用して、送信元でファイルのサブセットのみを転送することができます。フィルタリングの設定オプションは次のとおりです。

  • データ転送設定 セクションでは、除外パターンセクションを使用して、転送対象から除外するファイル、フォルダ、オブジェクトを指定できます。特定のファイル、フォルダ、およびオブジェクトを転送に含めるには、特定のファイルとフォルダインクルードパターン セクションに追加します。

  • フィルターにパターンを追加するには、[Add pattern (パターンを追加)] を選択します。フィルタリングおよびパターン作成の構文の詳細については、「DataSync によって転送されるデータのフィルタリング」を参照してください。

  • タスクを編集するときに、フィルターパターンを変更できます。タスクを実行するたびに異なるパターンを指定することもできます。

スケジューリングおよびキューイングオプション

スケジュールできます。 DataSync タスクは特定の時間に実行されます。1 つのエージェントを使用して複数のタスクを実行する場合は、それらのタスクをキューイングできます。スケジューリングのオプションの設定は次のとおりです。

  • スケジュール(オプション) セクションでは、指定したスケジュールでタスクが実行されるように設定できます(最小間隔は 1 時間)。

  • [Frequency (頻度)] で、タスクを実行する頻度を設定します。周波数設定オプションについては、「タスクスケジュールの設定」を参照してください。

1 つのエージェントで複数のタスクを実行する場合は、Queueing (キューイング) を選択して、タスクを連続して実行します(先入れ先出し)。詳細については、「タスク実行のキューイング」を参照してください。

タグとロギングオプション

には 1 つ以上のタグを追加できます。 DataSync タスク。タグは、タスクに関連付けられているキーと値のペアです。使用するログオプションを選択することもできます。 DataSync 個々のファイルまたはオブジェクトのログを CloudWatch 指定したロググループ。タグとロギングオプションは次のとおりです。

  • タグ (オプション) セクションで キー および を入力して、タスクのタグ付けを行います。タグは、タスクの管理、フィルタリング、検索に便利なキー値ペアです。タスクの名前タグを作成することが推奨されます。

  • 選択タスクロギング-オプショナルが必須です DataSync 個々のファイルまたはオブジェクトのログを CloudWatch 指定したロググループ。

    ログをにアップロードするには CloudWatch ロググループ、 DataSync には、十分なアクセス許可を付与するリソースポリシーがに必要です。現在のリージョンにポリシーがない場合は、チェックボックスが表示され、必要なポリシーを自動的に作成できます。このようなポリシーの例については、「DataSync がAmazon CloudWatch ロググループにログをアップロードすることを許可する」を参照してください。

    ロググループとストリームの使用の詳細については、「」を参照してください。ロググループとログストリームを操作するアマゾン CloudWatch ログユーザーガイド

    を使用するログレベルログに記録される詳細レベルを設定するオプション CloudWatch ログ。ログレベルオプションは以下のとおりです。

    • 基本情報(転送エラーなど)のみを CloudWatch に公開する場合は、転送エラーなどの基本情報をログ記録する を選択します。

    • 選択転送されたすべてのオブジェクト、ファイル、フォルダをログに記録するログレコードを公開するには CloudWatch タスクがコピーし、整合性チェックを行うすべてのファイルまたはオブジェクトのログを記録します。

    • 選択CloudWatch にログを送信しないでください必要ない場合 DataSync CloudWatch に公開されるログ。

[] を選択して [Review (確認)] ページを開きます。