기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon Translate에 병렬 데이터 추가
Amazon Translate에 병렬 데이터를 추가하려면 Amazon S3에서 병렬 데이터 입력 파일을 가져오세요. 그런 다음 병렬 데이터를 사용하여 배치 번역 작업에서 생성되는 출력을 사용자 지정할 수 있습니다.
사전 조건
Amazon Translate에 병렬 데이터를 추가하려면 먼저 다음을 수행해야 합니다.
-
병렬 데이터 입력 파일이 있어야 합니다. 파일을 만들려면 Amazon Translate의 병렬 데이터 입력 파일 섹션을 참조하세요.
-
AWS 계정에 Amazon S3 버킷이 있어야 합니다. 버킷을 생성하려면 Amazon Simple Storage Service 사용 설명서의 S3 버킷을 생성하려면 어떻게 해야 합니까? 섹션을 참조하세요.
-
Amazon S3 버킷에 입력 파일을 업로드합니다. 자세한 내용은 Amazon Simple Storage Service 사용 설명서의 S3 버킷에 파일 및 폴더를 업로드하려면 어떻게 해야 합니까? 섹션을 참조하세요.
병렬 데이터 추가(Amazon Translate 콘솔)
Amazon Translate 콘솔을 사용하여 병렬 데이터를 추가하려면 병렬 데이터 페이지를 사용하세요.
Amazon Translate 콘솔
을 엽니다. -
왼쪽의 탐색 메뉴에서 사용자 지정을 선택하고 병렬 데이터를 선택합니다.
-
병렬 데이터 페이지에서 병렬 데이터 생성을 선택합니다. 콘솔에 병렬 데이터 생성 페이지가 표시됩니다.
-
다음을 제공합니다.
- 이름
-
병렬 데이터 리소스의 사용자 지정 이름입니다. 계정 및 리전에서 고유한 이름을 할당해야 합니다.
- 설명 - 선택 사항
-
사용자 지정 설명입니다.
- S3의 병렬 데이터 위치
-
Amazon S3에서 병렬 데이터 입력 파일의 위치입니다. Amazon S3에서 파일을 탐색하여 위치를 제공하려면 파일 선택을 선택합니다.
- 파일 형식
-
병렬 데이터 입력 파일의 형식입니다. 지원되는 형식은 TMX(Translation Memory eXchange), CSV(쉼표로 구분된 값), TSV(탭으로 구분된 값)입니다.
-
암호화 키에서 병렬 데이터를 보호할 AWS KMS key를 선택합니다. 이러한 KMS 키는 AWS Key Management Service(AWS KMS)에서 관리합니다. AWS KMS에 대한 자세한 내용은 AWS Key Management Service 개발자 안내서 섹션을 참조하세요.
- AWS 소유 키 사용
-
Amazon Translate에서 소유하고 관리하는 KMS 키를 사용합니다. 이 옵션은 기본 옵션이며 다른 방법을 선택하지 않는 경우 정보를 보호하는 데 이 옵션이 사용됩니다. 자세한 내용은 AWS Key Management Service 개발자 안내서에서 AWS 소유 키 섹션을 참조하세요.
- 현재 계정의 키 사용
-
AWS 계정의 AWS KMS에서 관리하는 KMS 키 중 하나를 사용합니다. 이 옵션을 선택하면 선택할 수 있는 KMS 키 목록이 메뉴에 표시됩니다. 자세한 내용은 AWS Key Management Service 개발자 안내서의 고객 관리형 키 섹션을 참조하세요.
- 다른 계정의 키 사용
-
다른 AWS 계정의 AWS KMS에서 관리되는 KMS 키를 사용합니다. 이 옵션을 선택하면 KMS 키의 Amazon 리소스 이름(ARN)을 입력할 수 있는 상자가 콘솔에 표시됩니다.
암호화 키에 대한 자세한 내용은 AWS Key Management Service 개발자 안내서를 참조하세요.
-
병렬 데이터 생성을 선택합니다.
콘솔은 병렬 데이터 페이지로 돌아가고, 페이지 상단의 배너에 가져오기 상태가 표시됩니다. 몇 분 후, 병렬 데이터 리소스가 표에 표시됩니다. 상태 열의 값이 활성이면 병렬 데이터를 배치 번역 작업에 사용할 수 있습니다.
문제 해결을 위한 오류 파일
Amazon Translate에서 입력 파일을 처리하는 동안 오류나 경고가 발생하는 경우 콘솔은 오류 메시지 검토를 위해 다운로드할 수 있는 오류 파일을 제공합니다. 다음은 이 파일의 내용을 보여주는 예제입니다.
{
"summary": {
"record_error_count": 1,
"record_skipped_count": 0
},
"messages": [
{
"content": "Number 1 TU element",
"message": "Invalid TMX format. One tu element should contain exactly one tuv element with the source language code: en"
}
]
}
병렬 데이터 추가(AWS CLI)
AWS CLI를 사용하여 병렬 데이터를 추가하려면 create-parallel-data
명령을 사용합니다.
예 create-parallel-data 명령
다음 예제는 Amazon S3에서 TSV 파일을 가져와서 병렬 데이터 객체를 생성합니다.
$
aws translate create-parallel-data \>
--namemy-parallel-data
\>
--parallel-data-config S3Uri=s3://input-bucket
/parallel-data-file.tsv
,Format=TSV
명령이 성공하면 Amazon Translate는 새로운 병렬 데이터 객체의 상태로 응답합니다.
{ "Name": "my-parallel-data", "Status": "CREATING" }
get-parallel-data
명령을 사용하여 병렬 데이터의 상태를 지속적으로 모니터링할 수 있습니다. 상태 값이 ACTIVE
이면 병렬 데이터를 배치 번역 작업에 사용할 수 있습니다. get-parallel-data
명령의 예제는 병렬 데이터 객체에 대한 세부 정보를 보려면 섹션을 참조하세요.
병렬 데이터 사용
이제 병렬 데이터 리소스를 생성했으므로 이 리소스를 배치 번역 작업에 적용하여 출력을 사용자 지정할 수 있습니다. 배치 작업을 실행하려면 배치 번역 작업 실행 섹션을 참조하세요.