목록을 사용하여 사용자 지정 어휘 만들기 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

목록을 사용하여 사용자 지정 어휘 만들기

AWS Management ConsoleAWS CLI, 또는 AWS SDK를 사용하여 목록에서 사용자 지정 어휘를 만들 수 있습니다.

  • AWS Management Console: 사용자 지정 어휘가 포함된 텍스트 파일을 만들어 업로드해야 합니다. 줄로 구분된 항목이나 쉼표로 구분된 항목을 사용할 수 있습니다. 목록은 텍스트 (*.txt) 형식의 파일로 저장해야 합니다. LF 등의 다른 형식을 사용하는 CRLF 경우 사용자 지정 어휘는 에서 허용되지 않습니다Amazon Transcribe.

  • AWS CLIAWSSDK: 플래그를 사용하여 API 호출 내에 쉼표로 구분된 항목으로 사용자 지정 어휘를 포함해야 합니다. Phrases

항목에 여러 단어가 포함된 경우 각 단어에 하이픈을 넣어야 합니다. 예를 들어 '로스앤젤레스'를, '안도라 라 Los-Angeles 베야'를 차례로 포함합니다. Andorra-la-Vella

다음은 두 가지 유효한 목록 형식의 예입니다. 메서드별 맞춤 어휘 목록 만들기 예는 를 참조하십시오.

  • 쉼표로 구분된 항목:

    Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  • 줄로 구분된 항목:

    Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
중요

해당 언어에 지원되는 문자만 사용할 수 있습니다. 자세한 내용은 해당 언어의 문자 집합을 참조하십시오.

사용자 지정 어휘 목록은 CreateMedicalVocabulary작업에서 지원되지 않습니다. 사용자 지정 의학 어휘를 만들려면 표 형식을 사용해야 합니다. 자세한 테이블을 사용하여 사용자 지정 어휘 생성 내용은 을 참조하십시오.

맞춤 어휘 목록 만들기

와 함께 Amazon Transcribe 사용할 사용자 지정 어휘 목록을 처리하려면 다음 예를 참조하십시오.

이 예제에서는 create-vocabulary 명령을 목록 형식의 사용자 지정 어휘 파일과 함께 사용합니다. 자세한 정보는 CreateVocabulary을 참조하세요.

aws transcribe create-vocabulary \ --vocabulary-name my-first-vocabulary \ --language-code en-US \ --phrases {CLI,Eva-Maria,ABCs}

다음은 create-vocabulary 명령어와 사용자 지정 어휘를 생성하는 요청 본문을 사용하는 또 다른 예제입니다.

aws transcribe create-vocabulary \ --cli-input-json file://filepath/my-first-vocab-list.json

my-first-vocab-list.json 파일에는 다음과 같은 요청 본문이 들어 있습니다.

{ "VocabularyName": "my-first-vocabulary", "LanguageCode": "en-US", "Phrases": [ "CLI","Eva-Maria","ABCs" ] }

에서 PENDINGVocabularyState READY 변경되면 맞춤형 어휘를 트랜스크립션과 함께 사용할 수 있습니다. 사용자 지정 어휘의 현재 상태를 확인합니다.

aws transcribe get-vocabulary \ --vocabulary-name my-first-vocabulary

이 예제에서는 create_vocabulary 메서드를 사용하여 목록에서 사용자 지정 어휘를 만듭니다. AWS SDK for Python (Boto3) 자세한 정보는 CreateVocabulary을 참조하세요.

기능별, 시나리오 및 크로스 서비스 예제를 포함하여 AWS SDK를 사용하는 추가 예제는 이 장을 참조하십시오. SDK를 사용한 Amazon Transcribe의 코드 예제 AWS

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_vocabulary( LanguageCode = 'en-US', VocabularyName = vocab_name, Phrases = [ 'CLI','Eva-Maria','ABCs' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
참고

사용자 지정 어휘 파일을 위한 새 Amazon S3 버킷을 만드는 경우 CreateVocabulary요청을 하는 IAM 역할에 이 버킷에 액세스할 권한이 있는지 확인하세요. 역할에 올바른 권한이 없으면 요청이 실패합니다. DataAccessRoleArn파라미터를 포함하여 요청 내에서 IAM 역할을 지정할 수도 있습니다. 의 IAM 역할 및 정책에 대한 자세한 내용은 Amazon Transcribe 을 참조하십시오Amazon Transcribe 자격 증명 기반 정책 예제.