タスクの作成 - AWS DataSync

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

タスクの作成

DataSync を初めて使用する場合は、」AWS DataSync の使用を開始するタスクを作成する手順について説明します。

DataSync のタスクの作成

種類が異なる送信元および送信先から転送を実行するタスクを作成できます。DataSync でサポートされているすべての送信元エンドポイントと送信先エンドポイントのリストについては、「」を参照してください場所の使用

タスクを初めて作成する場合、このタスクは [作成中] ステータスになります。実行時作成中ステータスの場合、AWS DataSync は NFS、SMB、または自己管理オブジェクトのストレージ場所をマウントしようとします。タスクは、AWS の場所が使用可能になるまで待機せずに、[使用可能] ステータスに移行します。自己管理型の場所に関連付けられたエージェントがオフラインになった場合、タスクは使用不可ステータスがである。

タスクのステータスが [] の [] のままである場合作成中ステータスの数分間以上、エージェントによる NFS、SMB、または自己管理型オブジェクトストレージファイルシステムのマウント時にトラブルが発生した可能性があります。タスクのErrorCodeおよびErrorDetailこのガイドの API リファレンスセクションの「API リファレンス」を参照してください。多くの場合、マウントの問題はファイアウォールの誤設定か、NFS、SMB、または自己管理型オブジェクトストレージサーバーホスト名の入力ミスが原因で発生します。トラブルシューティング情報については、「AWS DataSync の問題をトラブルシューティングする」を参照してください。

セルフマネージドストレージと AWS 間でデータを転送するタスクの作成

タスクを前に作成したことがあり、追加のタスクを作成する場合は、次の手順を使用します。

タスクを作成するには

  1. を開くAWS DataSyncコンソールの場所https://console.aws.amazon.com/datasync/

  2. ナビゲーションペインで [タスク] を選択してから、[Create task (タスクの作成)] を選択します。

  3. [Configure source location (送信元の場所の設定)] ページで [Create new location (新しい場所の作成)] を選択し、送信元の新しい場所を使用する場合には新しい場所を設定します。構成設定を指定し、[Next (次へ)] を選択します。場所を作成する手順については、「場所の使用」を参照してください。

    以前に作成した送信元の場所を使用する場合は、[Choose existing location (既存の場所を選択)] を選択して一覧から送信元の場所を選び、[] を選択します。

    手順については、「送信元の場所を設定する」を参照してください。

クラウド内のロケーション間で転送するタスクの作成

以下の手順に従って、データ転送用に DataSync Amazon EC2 エージェントをセットアップします。このセクションの例では、以下のユースケースを取り扱います。

クラウド内 NFS からクラウド内 NFS または S3 に転送するタスクを作成する

クラウド内の NFS ファイルシステムから AWS にデータを転送するには、次の手順に従います。この転送を実行するには、DataSync エージェントが、ファイルシステムがデプロイされているのと同じ AWS リージョンおよび同じ AWS アカウントに配置されている必要があります。このタイプの転送には、EFS から EFS、自己管理型 NFS から Amazon EFS、および Amazon S3 があります。クラウド内 NFS からクラウド内 NFS または S3 への転送の仕組みについては、「クラウド内のファイルシステムから、クラウド内のファイルシステムまたは Amazon S3 へのデータ転送」を参照してください。

注記

ソース EFS または自己管理型の NFS ファイルシステムがある AWS リージョンおよび AWS アカウントにエージェントをデプロイします。

DataSync エージェントを EC2 インスタンスとしてデプロイして、クラウド内からファイルを読み取ります

DataSync エージェントを EC2 インスタンスとしてデプロイするには

  1. ソース EFS がある AWS アカウントを使用して、Amazon EC2 起動ウィザードから、Amazon マシンイメージ(AMI)を使用するエージェントを起動します。次の URL を使用して AMI を起動します。

    https://console.aws.amazon.com/ec2/v2/home?region=source-efs-or-nfs-region#LaunchInstanceWizard:ami=ami-id

    URL の source-efs-or-nfs-regionami-id を独自の値に置き換えます。

    AMI の起動後、インスタンスタイプの選択が Amazon EC2 コンソールに表示されます。AWS リージョン別の AMI ID のリストについては、EC2 インスタンスとしてエージェントをデプロイして、クラウド内のファイルシステムにアクセスします。 を参照してください。

  2. ユースケースに合った、推奨されるインスタンスタイプのいずれかを選択し、[: インスタンスの詳細の設定。推奨されるインスタンスタイプについては、「Amazon EC2 インスタンスの要件」を参照してください。

  3. [Configure Instance Details] ページで以下の操作を実行します。

    1. [ネットワーク] で、ソース EFS または NFS がある VPC を選択します。

    2. [パブリック IP の自動割り当て] の値を選択します。インスタンスをパブリックインターネットからアクセス可能にする場合は、[自動割り当てパブリック IP] を [有効化] に設定します。それ以外の場合は、[自動割り当てパブリック IP] を [無効化] に設定します。パブリック IP アドレスが割り当てられていない場合は、プライベート IP アドレスを使用して、VPC のエージェントをアクティブ化します。

      ファイルをクラウド内の NFS から転送してパフォーマンスを高める場合は、NFS サーバーがある [プレイスメントグループ] を選択することをお勧めします。

  4. [Next: (次へ:)] を選択します ストレージの追加。エージェントにストレージを追加する必要はないため、このスキップはスキップして、次へ: タグを追加する

  5. (オプション) [タグの追加] ページで、タグを EC2 インスタンスに追加することができます。このページのステップが完了したら、[] を選択します。次へ: セキュリティグループの設定

  6. [セキュリティグループの設定] ページで、次の操作を行います。

    1. 選択したセキュリティグループで、エージェントのアクティブ化に使用するウェブブラウザから HTTP ポート 80 へのインバウンドアクセスが許可されていることを確認します。

    2. ソース EFS または NFS で、エージェントからのインバウンドトラフィックが許可されていることを確認します。さらに、ソース EFS または NFS へのアウトバウンドトラフィックがエージェントで許可されていることを確認します。トラフィックは標準の NFS ポート 2049 を通過します。

    DataSync のネットワーク要件の完全なセットについては、DataSync のネットワーク要件

  7. [確認と作成] を選択して設定を確認し、[作成] を選択してインスタンスを作成します。アクセス可能なキーペアを使用することを忘れないでください。確認ページが表示され、インスタンスが起動していることが示されます。

  8. [View Instances] を選択して確認ページを閉じ、EC2 インスタンス画面に戻ります。インスタンスを起動した直後のステータスは [pending (保留中)] です。インスタンスが起動されると、状態は [running (実行中)] に変わります。この時点では、パブリックドメインネームシステム (DNS) 名と IP アドレスが割り当てられています。これらの情報は、[説明] タブで確認できます。

  9. [パブリック IP の自動割り当て] を [Enable (有効化)] に設定している場合は、インスタンスを選択して、[説明] タブ のパブリック IP アドレスを書き留めます。この IP アドレスは、同期エージェントに接続するために後に使用します。

    [パブリック IP の自動割り当て] を [Disable (無効化)] に設定している場合は、VPC の既存のインスタンスを起動または使用してエージェントをアクティブ化します。この場合は、同期エージェントのプライベート IP アドレスを使用して、VPC のこのインスタンスからエージェントをアクティブ化します。

EFS または自己管理型ストレージからデータを転送するタスクの作成

次に、データを転送するタスクを作成します。

注記

送信先の EFS または S3 バケットがある AWS リージョンおよび AWS アカウントにタスクを作成します。

タスクを作成するには

  1. 送信先の Amazon EFS ファイルシステムがある AWS リージョンの DataSync コンソールを開きます。送信先の EFS または S3 バケットが同じ AWS アカウントに存在している必要があります。

  2. 選択タスクの作成を選択して [] を選択します。オンプレミスから AWS へユースケースのオプション] ページを選択し、[エージェントの作成

  3. [エージェントの作成] ウィザードの [アクティベーション] セクションで、[エージェントのアドレス] に EC2 インスタンスの IP アドレスを入力し、[キーの取得] を選択します。この IP アドレスはプライベートまたはパブリックです。詳細については、「DataSync エージェントを EC2 インスタンスとしてデプロイするには」のステップ 9 を参照してください。

    ブラウザは、エージェントから一意のアクティベーションキーを取得するために、この IP アドレスに接続されます。このキーによって、エージェントは AWS アカウントに関連付けられます。この IP アドレスは、ネットワーク外部からアクセス可能である必要はありませんが、ブラウザからアクセスできる必要があります。

  4. 後で簡単に識別することができるエージェント名を入力し、入力後 [エージェントの作成] を選択します。必要に応じて、エージェントにタグを追加することができます。

  5. ナビゲーションペインから [Tasks] を選択します。

  6. [オンプレミスから AWS]、[Next] の順に選択し、[ソース設定] ページを開きます。

  7. [Source location options (ソースの場所のオプション)] で、[Create new location (新しい場所の作成)] を選択してから、[Network File System (NFS) or Server Message Block (SMB) (ネットワークファイルシステム (NFS) またはサーバーメッセージブロック (SMB))] を選択します。次のオプションに入力します。

    • エージェントのリストから、新しく作成されたエージェントを選択します。

    • EFS からコピーする場合は、次のように行います。

      • [NFS サーバー] に、ソース EFS の [DNS 名] を入力します。

      • を使用する場合マウントパスと入力します。/(スラッシュ) を選択し、[

    • 自己管理型 NFS または SMB からコピーする場合は、以下の操作を行います。

      • [NFS サーバー] に、プライベート DNS、またはソース NFS の IP アドレスを入力します。

      • [マウントパス] に、NFS サーバーによってエクスポートされたパスを入力し、[Next] を選択します。詳細については、「」を参照してくださいNFS の場所を作成する

  8. [Create new location (新しい場所の作成)] を選択します。これは、データ転送先の場所を表します。次のオプションに入力します。

    • EFS にコピーする場合は、次のように行います。

      • [Location type (場所のタイプ)] で、[EFS] を選択します。

      • 送信先の EFS を選択します。

      • を使用する場合マウントパスと入力します。/(スラッシュ)。

      • [サブネット] および [セキュリティグループ] で、デフォルト設定を使用して、[Next] を選択します。

    • S3 にコピーする場合は、次のように行います。

      • を使用する場合場所の種類で [Amazon S3 バケット] を選択します。

      • [S3 バケット] で、送信先の S3 バケットを選択します。

      • [フォルダ] で、転送に使用するフォルダのプレフィックスを選択するか、空白のままにします。

      • 送信先の S3 バケットとオプションのフォルダを選択します。DataSyncは自動生成することができますAWS Identity and Access Management(IAM) ロールを使用して、バケットにアクセスすることもできます。また、独自のロールを作成することもできます。

  9. [Next] を選択し、必要に応じてタスクに名前を付け、タグを追加します。

  10. ページの下部にある Amazon CloudWatch Logs グループを選択するか、作成して、[。CloudWatch Logs の使用方法の詳細については、「」を参照してください。DataSync が Amazon CloudWatch ロググループにログをアップロードできるようにする

  11. 次のページで設定を確認し、[タスクの作成] を選択します。

  12. [開始] を選択して、データの転送を開始するために先ほど作成したタスクを実行します。

S3 からクラウド内 NFS に転送するタスクを作成する

S3 から、エージェントがデプロイされているのと同じ AWS アカウントおよび AWS リージョンにあるクラウド内の NFS ファイルシステムにデータを転送するには、次の手順に従います。このアプローチには、S3 から EFS、または S3 から自己管理型 NFS への転送が含まれます。次の図は、このタイプの転送を示したものです。S3 からクラウド内 NFS への転送の詳細については、「S3 からクラウド内のファイルシステムへのデータ転送」を参照してください。

宛先ロケーションに書き込むための DataSync EC2 エージェントのデプロイ

まず、DataSync EC2 エージェントを、送信先の EFS または自己管理型の NFS がある AWS リージョンおよび AWS アカウントにデプロイします。

エージェントをデプロイするには

  • 選択した AMI からエージェントを起動するには、EC2 起動ウィザードを使用します。そのためには、次の URL を使用します。

    https://console.aws.amazon.com/ec2/v2/home?region=DESTINATION-EFS-or-NFS-REGION#LaunchInstanceWizard:ami=AMI-ID.

    URL で、AWS リージョンおよび AMI ID を独自のものに置き換えます。EC2 コンソールの [インスタンスタイプの選択] ページにリダイレクトされます。AWS リージョン別の AMI ID のリストについては、EC2 インスタンスとしてエージェントをデプロイして、クラウド内のファイルシステムにアクセスします。 を参照してください。

Amazon S3 からデータを転送するタスクを作成する

次に、データを転送するタスクを作成します。

注記

ソース S3 バケットがある AWS アカウントおよび AWS リージョンにタスクを作成します。

S3 から EFS にか自己管理型 NFS または SMB にデータを転送するタスクを作成するには

  1. ソース S3 バケットがある AWS リージョンの DataSync コンソールを開きます。

  2. [タスクの作成] を選択後、ユースケース [AWS からオンプレミス] を選択します。

  3. [エージェントの作成] を選択します。

  4. [パブリック IP の自動割り当て] を [Enable (有効化)] に設定している場合は、インスタンスを選択して、[説明] タブ のパブリック IP アドレスを書き留めます。この IP アドレスは、同期エージェントに接続するために後に使用します。

    [パブリック IP の自動割り当て] を [Disable (無効化)] に設定している場合は、VPC の既存のインスタンスを起動または使用してエージェントをアクティブ化します。この場合は、同期エージェントのプライベート IP アドレスを使用して、VPC のこのインスタンスからエージェントをアクティブ化します。

  5. [エージェントの作成] ウィザードの [エージェントのアドレス] に、EC2 インスタンスの IP アドレス (プライベートまたはパブリック。ステップ 3 参照) を入力し、[キーの取得] を選択します。

    ブラウザは、エージェントから一意のアクティベーションキーを取得するために、この IP アドレスに接続されます。このキーによって、エージェントは AWS アカウントに関連付けられます。この IP アドレスは、ネットワーク外部からアクセス可能である必要はありませんが、ブラウザからアクセスできる必要があります。

  6. 後に識別しやすいエージェント名を選択します。必要に応じてタグを追加できます。追加したら、[エージェントの作成] を選択します。

  7. [AWS からオンプレミス]、[Next] の順に選択します。

  8. [Create new location (新しい場所の作成)] を選択します。

    • を使用する場合場所の種類で [Amazon S3 バケット] を選択します。

    • [S3 バケット] で、送信先の S3 バケットを選択します。

    • [フォルダ] で、転送用のフォルダのプレフィックスを選択するか、空白のままにします。

      DataSync では、バケットにアクセスするための IAM ロールを自動生成できます。または、独自のロールを作成することもできます。

  9. [Next (次へ)] を選択します。選択新しい場所の作成] で、NFS または SMBfor場所の種類をクリックして、リストから、作成したエージェントを選択します。

    1. EFS にコピーする場合は、次のように行います。

      • [NFS サーバー] に、ソース EFS の [DNS 名] を入力します。

      • を使用する場合マウントパスと入力します。/(スラッシュ) を選択し、[

    2. クラウド内の EFS にコピーする場合は、次のように行います。

      • [NFS サーバー] に、プライベート DNS、またはソース NFS の IP アドレスを入力します。

      • [マウントパス] に、NFS サーバーによってエクスポートされたパスを入力します。詳細については、「」を参照してくださいNFS の場所を作成する

  10. [Next] を選択し、必要に応じてタスクに名前を付け、タグを追加します。

  11. ページの下部にある CloudWatch Logs グループを選択するか、作成して、[。CloudWatch Logs の使用方法の詳細については、「」を参照してください。DataSync が Amazon CloudWatch ロググループにログをアップロードできるようにする

  12. 次のページで設定を確認し、[タスクの作成] を選択します。

  13. 選択を起動をクリックして、データを転送するために先ほど作成したタスクを実行し、[を起動をもう一度実行します。タスクの開始ページで.

タスク設定の構成

次に、タスクの設定を構成する方法を説明します。これらの設定を使用して、タスクの実行の動作方法を制御します。この設定は [オプション] セクションで使用できます。

これらのオプションは、タスク実行の動作を制御します。動作には、メタデータ (ユーザー ID (UID) やグループ ID (GID) など) の保持、ファイルのアクセス許可の保持やデータ整合性の検証が含まれています。これらのオプションの値を指定しない場合、DataSync はタスクの実行に上書きできるデフォルトの一連のオプションを使用します。

DataSync タスクの設定の詳細については、「」を参照してください。タスク設定の構成

使用できるオプションは以下のとおりです。

  • データ検証オプション: タスクデータ検証オプションは、タスクによって転送されるデータを検証する方法を指定します。これらのオプションの設定の詳細については、「」を参照してくださいデータ検証オプション

  • 所有権と権限に関連するオプション: DataSync は、類似したメタデータ構造を持つストレージシステム間でメタデータを保持します。このようなメタデータの保存を構成するには、ストレージシステムのタイプに応じて異なるオプションが使用されます。これらのオプションの設定の詳細については、「」を参照してください所有権とアクセス許可に関連するオプション

  • ファイル・メタデータ・オプションとファイル管理: DataSync タスクを構成して、ファイルのメタデータをコピーしたり、削除されたファイルを保持したり、コピー先のファイルを上書きしたりできます。ファイルのメタデータとファイル管理オプションの設定の詳細については、「」を参照してくださいファイル・メタデータ・オプションとファイル管理

  • 帯域幅オプション: DataSync タスクの帯域幅制限を構成できます。帯域幅オプションの構成の詳細については、「」を参照してください。帯域幅オプション

  • フィルターのオプション: 送信元から送信先にデータを転送するときに、フィルタを適用して、送信元でファイルのサブセットのみを転送することができます。フィルタリングオプションの構成の詳細については、「」を参照してください。フィルターのオプション

  • スケジューリングおよびキューイングオプション: DataSync タスクを特定の時間に実行するようにスケジュールできます。1 つのエージェントを使用して複数のタスクを実行する場合は、これらのタスクをキューに入れることができます。スケジューリングおよびキューイングオプションの設定の詳細については、「」を参照してください。スケジューリングおよびキューイングオプション

  • タグとログオプション: DataSync タスクに 1 つ以上のタグを追加できます。ロギングオプションを選択して、DataSync が、指定した CloudWatch ロググループに個々のファイルまたはオブジェクトのログを発行することもできます。タグの設定とログ記録のオプションの詳細については、「」を参照してくださいタグとログオプション