Amazon Translate への並列データの追加 - Amazon Translate

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Translate への並列データの追加

Amazon Translate に並列データを追加するには、Amazon S3 から並列データ入力ファイルをインポートします。その後、並列データを使用して、バッチ翻訳ジョブによって生成される出力をカスタマイズできます。

前提条件

Amazon Translate に並列データを追加する前に、次の作業を行う必要があります。

並列データの追加 (Amazon Translate コンソール)

Amazon Translate コンソールを使用して並列データを追加するには、並列データページを使用します。

  1. Amazon Translate コンソール を開きます。

  2. 左側のナビゲーションメニューで、[Customization (カスタマイズ)] を選択し、[Parallel data (並列データ)] を選択します。

  3. [Parallel data (並列データ)] ページで [Create parallel data (並列データの作成)] を選択します。コンソールに [Create parallel data (並列データの作成)] ページが表示されます。

  4. 以下を指定します。

    Name (名前)

    並列データリソースのカスタム名。アカウントとリージョンで一意の名前を割り当てる必要があります。

    Description (説明) - オプション

    カスタム説明。

    Parallel data location on S3 (S3 での並列データの場所)

    Amazon S3 での並列データ入力ファイルの場所。Amazon S3 のファイルに移動して場所を設けるには、[Select file (ファイルを選択)] を選択します。

    File format (ファイル形式)

    並列データ入力ファイルの形式。サポートされている形式は、Translation Memory eXchange (TMX)、カンマ区切り値 (CSV)、タブ区切り値 (TSV) です。

  5. [Encryption key (暗号化キー)] で、AWS KMS key を選択して並列データを保護します。これらの KMS キーは AWS Key Management Service (AWS KMS) によって管理されます。AWS KMS の詳細については、「AWS Key Management Service デベロッパーガイド」を参照してください。

    Use AWS owned key (AWS 所有キーを使用する)

    Amazon Translate によって所有され管理されている KMS キーを使用します。これはデフォルトのオプションであり、他の方法を選択しない場合に情報を暗号化するために使用されます。詳細については、AWS Key Management Service デベロッパーガイドの「AWS 所有キー」を参照してください。

    Use key from current account (現在のアカウントのキーを使用する)

    AWS アカウントの AWS KMS で管理している KMS キーのうちの 1 つを使用します。このオプションを選択すると、選択可能な KMS キーのリストがメニューに表示されます。詳細については、AWS Key Management Service デベロッパーガイドの「カスタマーマネージドキー」を参照してください。

    Use key from different account (別のアカウントのキーを使用する)

    別の AWS アカウントの AWS KMS で管理している KMS キーを使用します。このオプションを選択した場合、KMS キーの Amazon リソースネーム (ARN) を入力するためのフィールドがコンソールに表示されます。

    暗号化キーの詳細については、AWS Key Management Service デベロッパーガイドを参照してください。

  6. [Create parallel data (並列データの作成)] を選択します。

    コンソールが [Parallel data (並列データ)] ページに戻ります。このぺージの上部にあるバナーにインポートステータスが表示されます。数分後、並列データリソースが表に表示されます。[Status (ステータス)] 列の値が [Active (アクティブ)] である場合、並列データがバッチ翻訳ジョブで使用できる状態です。

トラブルシューティング用エラーファイル

Amazon Translate で入力ファイルの処理中にエラーや警告が発生した場合は、コンソールからエラーファイルが提供され、これをダウンロードするとエラーメッセージを確認できます。次に示すのは、エラーファイルのコンテンツの例です。

{ "summary": { "record_error_count": 1, "record_skipped_count": 0 }, "messages": [ { "content": "Number 1 TU element", "message": "Invalid TMX format. One tu element should contain exactly one tuv element with the source language code: en" } ] }

並列データの追加 (AWS CLI)

AWS CLI を使用して並列データを追加するには、create-parallel-data コマンドを使用します。

例 create-parallel-data コマンド

次の例では、Amazon S3 から TSV ファイルをインポートして並列データオブジェクトを作成します。

$ aws translate create-parallel-data \ > --name my-parallel-data \ > --parallel-data-config S3Uri=s3://input-bucket/parallel-data-file.tsv,Format=TSV

コマンドが成功すると、Amazon Translate から、新しい並列データオブジェクトのステータスでの応答があります。

{ "Name": "my-parallel-data", "Status": "CREATING" }

get-parallel-data コマンドを使用して並列データの進行状況を監視することができます。ステータスが ACTIVE である場合、並列データがバッチ翻訳ジョブで使用できる状態です。get-parallel-data コマンドの例については「並列データオブジェクトの詳細を表示する方法」を参照してください。

並列データの使用

並列データリソースを作成したので、バッチ翻訳ジョブに適用して出力をカスタマイズすることができます。バッチジョブを実行するには、バッチ翻訳ジョブの実行 を参照してください。