배치 번역 작업 실행 - Amazon Translate

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

배치 번역 작업 실행

Amazon Translate 콘솔 AWS CLI, 또는 Amazon Translate API를 사용하여 일괄 번역 작업을 실행할 수 있습니다.

참고

배치 번역 작업은 장기 실행 작업이며 완료하는 데 많은 시간이 걸릴 수 있습니다. 예를 들어 작은 데이터 세트에 대한 배치 번역은 몇 분 정도 걸릴 수 있지만 매우 큰 데이터 세트의 경우 2일 이상이 걸릴 수 있습니다. 완료 시간 또한 리소스의 가용성에 따라 다릅니다.

Amazon Translate 콘솔을 사용하여 번역 작업을 실행하려면 배치 번역 페이지를 사용하여 작업을 생성하세요.

  1. Amazon Translate 콘솔을 엽니다.

  2. 왼쪽 탐색 메뉴에서 배치 번역을 선택합니다.

  3. 번역 작업 페이지에서 작업 생성을 선택합니다. 콘솔에 번역 작업 생성 페이지가 표시됩니다.

  4. 작업 설정에서 다음을 수행합니다.

    1. 이름에 배치 번역 작업의 사용자 지정 이름을 입력합니다.

    2. 소스 언어에서 소스 파일의 언어를 선택합니다. 소스 파일의 언어를 모르거나 입력 문서에 다른 소스 언어가 포함되어 있는 경우 auto을 선택합니다. Amazon Translate가 각 파일의 소스 언어를 자동으로 감지합니다.

    3. 대상 언어로는 최대 10개 언어를 선택할 수 있습니다. Amazon Translate가 각 소스 파일을 해당하는 대상 언어로 번역합니다.

  5. 입력 데이터에서 다음 작업을 수행합니다.

    1. 입력 S3 위치에 번역 소스 파일이 들어 있는 Amazon S3의 입력 폴더를 지정합니다. Amazon S3에서 해당 폴더로 이동하여 폴더를 제공하려면 폴더 선택을 선택합니다.

    2. 파일 형식에서 번역 소스 파일의 형식을 선택합니다.

  6. 출력 데이터에서 다음 작업을 수행합니다.

    1. 출력 S3 위치에 Amazon Translate가 번역 출력을 저장할 Amazon S3의 출력 폴더를 지정합니다. Amazon S3에서 해당 폴더로 이동하여 폴더를 제공하려면 폴더 선택을 선택합니다.

    2. () 에서 관리하는 고객 관리 키로 출력을 암호화하려면 암호화 설정 사용자 지정 AWS Key Management Service (고급AWS KMS) 을 선택할 수도 있습니다.

      기본적으로 Amazon Translate는 사용자를 대신하여 AWS에서 생성, 관리 및 사용되는 KMS 키를 사용해 번역 출력을 암호화합니다. 자체 KMS 키를 사용하여 출력을 암호화하려는 경우 이 옵션을 선택하세요.

      현재 AWS 계정의 KMS 키를 사용하려면 키 선택에서 해당 키를 선택합니다. AWS Key Management Service 다른 AWS 계정의 KMS 키를 사용하려면 해당 키에 대한 Amazon 리소스 이름(ARN)을 입력합니다.

      참고

      자체 KMS 키를 사용하려면 먼저 IAM에서 Amazon Translate에 대한 서비스 역할에 권한을 추가해야 합니다. 다른 계정의 KMS 키를 사용하려면 에서도 키 정책을 업데이트해야 합니다. AWS KMS자세한 정보는 암호화를 사용자 지정하기 위한 사전 조건을 참조하세요.

  7. 사용자 지정 - 옵션에서 다음과 같은 설정으로 번역 작업의 출력을 사용자 지정하도록 선택할 수 있습니다.

    욕설

    번역 출력에서 비속적 단어와 구문을 마스킹합니다. 작업에 여러 대상 언어를 지정하는 경우, 해당하는 모든 대상 언어가 욕설 마스킹을 지원해야 합니다. 대상 언어 중 하나라도 욕설 마스킹을 지원하지 않는 경우 번역 작업은 모든 대상 언어의 욕설을 마스킹하지 않습니다.

    자세한 정보는 Amazon Translate에서 비속적 단어와 구문 마스킹을 참조하세요.

    간결함

    Amazon Translate는 일괄 번역 작업에 대한 간결성을 지원하지 않습니다.

    자세한 정보는 Amazon Translate에서 간결성 사용하기을 참조하세요.

    격식성

    일부 대상 언어의 경우 격식성을 격식 또는 비격식으로 설정할 수 있습니다. 작업에 여러 대상 언어를 지정하는 경우 Amazon Translate는 지원되지 않는 대상 언어에 대해서는 격식성 설정을 무시합니다.

    자세한 정보는 Amazon Translate에서 격식성 설정을 참조하세요.

    사용자 지정 용어

    예제 소스 용어와 각 용어에 대해 사용자가 원하는 번역으로 구성됩니다. 작업에 여러 대상 언어를 지정하는 경우 Amazon Translate는 용어집 파일에 소스 용어 항목이 있는 요청된 각 대상 언어에 대해 지정된 용어를 사용합니다.

    자세한 정보는 사용자 지정 용어로 번역 사용자 지정을 참조하세요.

    병렬 데이터

    텍스트 세그먼트를 어떻게 번역할지 보여주는 예제로 구성되어 있습니다. 작업에 대해 여러 대상 언어를 지정하는 경우 병렬 데이터 파일에는 모든 대상 언어에 대한 번역이 포함되어야 합니다.

    배치 번역 작업에 병렬 데이터를 추가하면 활성 사용자 지정 번역 작업이 생성됩니다.

    참고

    활성 사용자 지정 번역 작업은 병렬 데이터를 사용하지 않는 다른 작업보다 높은 요금이 책정됩니다. 자세한 내용은 Amazon Translate 요금을 참조하세요.

    자세한 정보는 병렬 데이터로 번역 사용자 지정(활성 사용자 지정 번역)을 참조하세요.

  8. 액세스 권한에서 Amazon S3의 입력 및 출력 파일에 필요한 권한을 부여하는 IAM 역할을 Amazon Translate에 제공해야 합니다.

    • 계정에 이 IAM 역할이 이미 있는 경우 기존 IAM 역할 사용을 선택하고 IAM 역할에서 해당 역할을 선택합니다.

    • 계정에 이 IAM 역할이 아직 없는 경우 IAM 역할 생성을 선택합니다. IAM 역할의 경우 입력 및 출력 S3 버킷을 선택합니다. 역할 이름에 원하는 이름을 입력합니다. 번역 작업을 생성하면 Amazon Translate에서 자동으로 역할을 생성합니다. IAM의 역할 이름 앞에는 -가 붙습니다. AmazonTranslate ServiceRole

      참고

      번역 출력을 자체 KMS 키로 암호화하기로 선택한 경우에는 IAM 역할 생성을 선택할 수 없습니다. 이 경우 기존 IAM 역할을 사용해야 하며, KMS 키에는 해당 역할이 키를 사용할 수 있도록 허용하는 키 정책이 있어야 합니다.

      자세한 정보는 암호화를 사용자 지정하기 위한 사전 조건섹션을 참조하십시오.

  9. 작업 생성을 선택합니다.

    콘솔은 번역 작업 페이지로 돌아가고, 페이지 상단의 배너에 작업 생성 상태가 표시됩니다. 몇 분 후 표에 작업이 표시됩니다.

  10. 이름 열에서 작업 이름을 선택하여 작업 세부정보 페이지를 엽니다.

    번역 작업이 실행되는 동안 상태 필드가 진행 중으로 표시됩니다.

  11. 상태가 완료됨으로 표시되면 출력 파일 위치 아래의 링크를 선택하여 번역 출력으로 이동합니다. 콘솔이 Amazon S3의 출력 버킷으로 이동합니다.

  12. 출력 파일을 다운로드하려면 각 파일의 확인란을 선택하고 다운로드를 선택합니다.

를 사용하여 번역 작업을 실행하려면 start-text-translation-job명령을 사용하고 parallel-data-names 매개 변수에 대한 병렬 데이터 리소스의 이름을 지정합니다. AWS CLI

예 S tart-text-translation-job 명령

다음 예제는 Amazon S3의 입력 버킷에 저장된 Excel 파일을 제출하여 번역 작업을 실행합니다. 이 작업은 요청에 포함된 병렬 데이터로 사용자 지정됩니다.

$ aws translate start-text-translation-job \ > --input-data-config ContentType=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet,S3Uri=s3://DOC-EXAMPLE-BUCKET/input/ \ > --output-data-config S3Uri=s3://DOC-EXAMPLE-BUCKET/output/ \ > --data-access-role-arn arn:aws:iam::111122223333:role/my-iam-role \ > --source-language-code en \ > --target-language-codes es it \ > --job-name my-translation-job

명령이 성공하면 Amazon Translate는 작업 ID 및 상태로 응답합니다.

{ "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobStatus": "SUBMITTED" }

번역 작업의 출력을 사용자 지정하려는 경우 다음 파라미터를 사용할 수 있습니다.

--settings

다음 옵션을 포함하여 번역 출력을 구성하기 위한 설정:

번역 출력에서 간결성을 켜십시오. Amazon Translate는 일괄 번역 작업에 대한 간결성을 지원하지 않습니다. 자세한 정보는 Amazon Translate에서 간결성 사용하기을 참조하세요.

욕설을 활성화하여 비속적 단어와 구를 마스킹합니다. 활성화하려면 파라미터를 Profanity=MASK로 설정합니다. 자세한 정보는 Amazon Translate에서 비속적 단어와 구문 마스킹을 참조하세요. 대상 언어 중 하나라도 욕설 마스킹을 지원하지 않는 경우 번역 작업은 모든 대상 언어의 욕설을 마스킹하지 않습니다.

번역 출력의 격식성 수준을 설정합니다. Formality 파라미터를 FORMAL 또는 INFORMAL로 설정합니다. 작업에 여러 대상 언어를 지정하는 경우 Amazon Translate는 지원되지 않는 대상 언어에 대해서는 격식성 설정을 무시합니다. 자세한 정보는 Amazon Translate에서 격식성 설정을 참조하세요.

--terminology-names

번역 작업에 추가할 사용자 지정 용어집 리소스의 이름입니다. 이 리소스에는 예제 소스 용어와 각 용어에 대해 사용자가 원하는 번역이 나열되어 있습니다. 작업에 여러 대상 언어를 지정하는 경우 Amazon Translate는 용어집 파일에 소스 용어 항목이 있는 요청된 각 대상 언어에 대해 지정된 용어를 사용합니다.

이 파라미터는 하나의 사용자 지정 용어 리소스만 허용합니다.

사용 가능한 사용자 지정 용어 리소스 목록을 보려면 list-terminologies 명령을 사용하세요.

자세한 정보는 사용자 지정 용어로 번역 사용자 지정을 참조하세요.

--parallel-data-names

번역 작업에 추가할 병렬 데이터 리소스의 이름입니다. 이 리소스는 텍스트 세그먼트를 어떻게 번역할지 보여주는 예제로 구성되어 있습니다. 작업에 대해 여러 대상 언어를 지정하는 경우 병렬 데이터 파일에는 모든 대상 언어에 대한 번역이 포함되어야 합니다.

번역 작업에 병렬 데이터를 추가하면 활성 사용자 지정 번역 작업이 생성됩니다.

이 파라미터는 하나의 병렬 데이터 리소스만 허용합니다.

참고

활성 사용자 지정 번역 작업은 병렬 데이터를 사용하지 않는 다른 작업보다 높은 요금이 책정됩니다. 자세한 내용은 Amazon Translate 요금을 참조하세요.

사용 가능한 병렬 데이터 리소스 목록을 보려면 list-parallel-data 명령을 사용하세요.

자세한 정보는 병렬 데이터로 번역 사용자 지정(활성 사용자 지정 번역)을 참조하세요.

번역 작업의 상태를 확인하려면 describe-text-translation-job 명령을 사용하세요.

예 D 명령 escribe-text-translation-job

다음 예제에서는 작업 ID를 제공하여 작업 상태를 확인합니다. 이 ID는 start-text-translation-job 명령으로 작업을 시작할 때 Amazon Translate에서 제공된 것입니다.

$ aws translate describe-text-translation-job \ > --job-id 4446f95f20c88a4b347449d3671fbe3d

Amazon Translate는 상태를 포함한 작업 속성으로 응답합니다.

{ "TextTranslationJobProperties": { "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobName": "my-translation-job", "JobStatus": "COMPLETED", "JobDetails": { "TranslatedDocumentsCount": 0, "DocumentsWithErrorsCount": 0, "InputDocumentsCount": 1 }, "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "it" ], "SubmittedTime": 1598661012.468, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/input/", "ContentType": "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" }, "OutputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/output/111122223333-TranslateText-4446f95f20c88a4b347449d3671fbe3d/" }, "DataAccessRoleArn": "arn:aws:iam::111122223333:role/my-iam-role" } }

JobStatus 값이 IN_PROGRESS인 경우 몇 분 정도 기다린 후 COMPLETED 상태가 될 때까지 describe-text-translation-job 명령을 다시 실행하세요. 작업이 완료되면 OutputDataConfig 아래 S3Uri 필드에 제공된 위치에 번역 결과를 다운로드할 수 있습니다.

Amazon Translate API를 사용하여 일괄 번역 작업을 제출하려면 StartTextTranslationJob작업을 사용하십시오.