사용자 지정 어휘 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

사용자 지정 어휘

사용자 지정 어휘를 사용하여 하나 이상의 특정 단어의 트랜스크립션 정확도를 향상시킵니다. 이러한 단어는 일반적으로 브랜드 이름 및 두문자어, 고유 명사 및 Amazon Transcribe 가 올바르게 렌더링하지 않은 단어 등 도메인별 용어입니다.

지원되는 모든 언어에 사용자 지정 어휘를 사용할 수 있습니다. 사용자 지정 어휘에는 해당 언어의 문자 집합에 나열된 문자만 사용할 수 있다는 점에 유의하세요.

중요

Amazon Transcribe사용 시 자체 데이터의 무결성에 대한 책임은 사용자에게 있습니다. 기밀 정보, 개인 정보(PII) 또는 보호 대상 건강 정보(PHI)를 사용자 지정 어휘에 입력하지 마세요.

사용자 지정 어휘를 생성할 때 고려할 사항:

  • 사용자 지정 어휘 파일은 한 개당 최대 100개까지 만들 수 있습니다. AWS 계정

  • 각 사용자 지정 어휘 파일의 크기 한도는 50Kb입니다.

  • API를 사용하여 사용자 지정 어휘를 만드는 경우 어휘 파일은 텍스트(*.txt) 형식이어야 합니다. 를 사용하는 경우 어휘 파일은 텍스트 (*.txt) 형식 또는 쉼표로 구분된 값 (*.csv) 형식일 수 있습니다. AWS Management Console

  • 사용자 지정 어휘 내의 각 항목은 256자를 초과할 수 없습니다.

  • 사용자 지정 어휘를 사용하려면 필사본과 동일하게 생성되어야 합니다. AWS 리전

작은 정보

를 사용하여 사용자 지정 어휘를 테스트할 수 있습니다. AWS Management Console사용자 지정 어휘를 사용할 준비가 되면 에 로그인하고 실시간 트랜스크립션을 선택하고 사용자 지정으로 스크롤한 다음 사용자 지정 어휘를 켜고 드롭다운 목록에서 사용자 지정 어휘를 선택합니다. AWS Management Console그런 다음 스트리밍 시작을 선택합니다. 사용자 지정 어휘의 일부 단어를 마이크에 대고 말하여 제대로 렌더링되는지 확인합니다.

사용자 지정 어휘 테이블과 목록 비교

중요

목록 형식의 사용자 지정 어휘는 더 이상 사용되지 않습니다. 새 사용자 지정 어휘를 만들려면 테이블 형식을 사용하세요.

테이블을 사용하면 사용자 지정 어휘 내에서 단어의 입력과 출력에 대한 더 많은 옵션과 제어를 제공합니다. 테이블을 사용하면 출력을 세밀하게 조정할 수 있도록 여러 범주((Phrase and DisplayAs))를 지정해야 합니다.

목록에는 추가 옵션이 없으므로 트랜스크립트에 표시할 항목만 입력할 수 있으며 모든 스페이스는 하이픈으로 대체됩니다.

AWS Management Console AWS CLI, 및 AWS SDK는 모두 같은 방식으로 사용자 지정 어휘 표를 사용합니다. 목록은 각 방법마다 다르게 사용되므로 두 방법 간에 성공적으로 사용하려면 추가 서식이 필요할 수 있습니다.

자세한 내용은 테이블을 사용하여 사용자 지정 어휘 생성목록을 사용하여 사용자 지정 어휘 만들기 섹션을 참조하세요.

Amazon Augmented AI를 사용자 지정 어휘와 함께 사용하는 방법을 좀 더 자세히 알아보려면 다음을 참조하세요.

사용자 지정 어휘와 관련된 API 작업