사용자 지정 어휘 - Amazon Transcribe

문서의 영문과 번역 사이에 충돌이 있는 경우에는 영문 버전을 따릅니다. 번역 버전은 기계 번역을 사용하여 제공합니다.

사용자 지정 어휘

사용자 지정 어휘를 작성하면 입력 파일의 음성을 처리하는 방법에 대해 추가 정보를 Amazon Transcribe에 제공할 수 있습니다. 사용자 지정 어휘는 Amazon Transcribe가 오디오 입력에서 인식하게 하려는 특정 단어의 목록입니다. 일반적으로 해당 분야의 전문 용어 및 구절이며, Amazon Transcribe가 인식하지 않는 단어 또는 고유 명사입니다.

사용자 지정 어휘는 특정 단어 또는 구절을 대상으로 사용하기에 가장 적합합니다. 모든 녹음에 사용하기 위해 많은 용어가 포함된 단일 어휘를 만드는 것보다 특정 오디오 녹음에 맞춘 작은 크기의 개별 어휘를 생성하는 것이 좋습니다. 계정당 최대 100개의 어휘를 보유할 수 있습니다. 사용자 지정 어휘의 크기 한도는 50Kb입니다.

사용자 지정 어휘는 텍스트 파일로 지정합니다. 어휘 내에 단어 목록을 지정하거나 사용자 지정 어휘 내 단어에 대한 입력과 출력을 보다 세부적으로 제어하려면 4개 열로 구성된 테이블을 지정할 수 있습니다.

사용자 지정 어휘 작성에 대한 자세한 정보는 목록을 사용하여 사용자 지정 어휘 만들기테이블을 사용하여 사용자 지정 어휘 만들기 단원을 참조하십시오.

사용자 지정 어휘를 작성하려면 CreateVocabulary 작업 또는 Amazon Transcribe 콘솔을 사용합니다. CreateVocabulary 요청을 제출하면 Amazon Transcribe에서 어휘를 처리합니다. 어휘의 처리 상태를 보려면 콘솔을 사용하거나 GetVocabulary 작업을 사용합니다.

참고

Amazon Transcribe 콘솔을 사용하여 사용자 지정 어휘를 업로드할 경우 어휘 테이블 대신 어휘 목록을 사용해야 합니다. 어휘 테이블을 사용하여 사용자 지정 어휘를 작성하기 위해 콘솔을 사용하려면 원본 파일이 Amazon S3 버킷에 있어야 합니다.

사용자 지정 어휘를 사용하려면 StartTranscriptionJob 작업을 호출할 때 Settings 필드의 VocabularyName 필드를 설정하거나 트랜스크립션 작업을 작성할 때 콘솔에서 어휘를 선택해야 합니다.

목록을 사용하여 사용자 지정 어휘 만들기

텍스트 파일에서 단어 목록 또는 구절을 사용하여 사용자 지정 어휘를 만들 수 있습니다. 각 단어를 한 줄씩 배치하거나 단어나 구절을 쉼표로 서로 분리하여 한 줄에 여러 단어를 배치할 수도 있습니다.

각 항목은 다음과 같이 구성되어야 합니다.

  • 256자 미만(하이픈 포함)

  • 허용되는 문자 집합의 문자만

유효한 문자 집합은 사용자 지정 어휘의 문자 집합 단원을 참조하십시오.

구절 목록으로 된 항목의 경우 구절의 단어를 하이픈으로 구분합니다. 예를 들어 구절이 Los Angeles인 경우 파일에 Los-Angeles의 형식으로 입력합니다.

머리글자어 또는 문자를 개별적으로 발음해야 하는 기타 단어는 점으로 구분된 단일 문자로 입력합니다(예: A.B.C. 또는 F.B.I.). 머리글자어의 복수 형태를 입력하려면(예: "ABCs") 하이픈을 사용해 머리글자어에서 "s"를 구분합니다(예: A.B.C.-s). 대문자 또는 소문자를 사용해 머리글자어를 입력할 수 있습니다. 두문자어는 다음 언어로 지원됩니다.

  • 네덜란드어

  • 모든 영어 변종

  • 모든 프랑스어 변종

  • 모든 독일어 변종

  • 힌디어

  • 인도네시아어

  • 이탈리아어

  • 말레이어

  • 모든 포르투갈어 변종

  • 모든 스페인어 변종

  • 터키어

다음은 어휘 단어와 구절이 별도의 줄로 구분된 입력 파일의 내용을 나타내는 예제입니다.

Los-Angeles F.B.I. Etienne

다음은 어휘 단어와 구절이 한 줄에 쉼표로 구분된 입력 파일의 내용을 나타내는 예제입니다.

Los-Angeles,F.B.I.,Etienne

테이블을 사용하여 사용자 지정 어휘 만들기

텍스트 파일에서 테이블을 만들어 사용자 지정 어휘를 만들 수 있습니다. 테이블의 각 행은 단어 또는 구절로 구성되며 IPA, SoundsLikeDisplayAs 필드를 선택적으로 추가할 수 있습니다. 각 필드는 다음과 같이 구성되어야 합니다.

  • 256자 미만(하이픈 포함)

  • 허용되는 문자 집합의 문자만

유효한 문자 집합은 사용자 지정 어휘의 문자 집합 단원을 참조하십시오.

텍스트 파일에 각 단어나 구절을 별도의 줄에 배치합니다. TAB 문자로 필드를 구분합니다. API를 호출하는 리전과 동일한 리전의 Amazon S3 버킷에서 .txt 확장자를 사용하여 파일을 저장합니다.

다음은 텍스트 형식의 입력 파일 예입니다. 이 예제에서는 공백을 사용하여 열을 정렬합니다. 입력 파일은 TAB 문자를 사용하여 열을 구분해야 합니다. IPADisplayAs 열에만 공백을 포함합니다. 이러한 예제를 복사하는 경우 열 사이의 여분의 공백을 제거하고 “[TAB]”를 TAB 문자로 바꿉니다.

Phrase [TAB]IPA [TAB]SoundsLike[TAB]DisplayAs Los-Angeles[TAB] [TAB] [TAB]Los Angeles F.B.I. [TAB]ɛ f b i aɪ[TAB] [TAB]FBI Etienne [TAB] [TAB]eh-tee-en [TAB]

열 입력 순서에는 제한이 없습니다. 다음 역시 사용자 지정 어휘 입력 파일의 유효한 구조입니다.

Phrase [TAB]SoundsLike[TAB]IPA [TAB]DisplayAs Los-Angeles[TAB] [TAB] [TAB]Los Angeles F.B.I [TAB] [TAB]ɛ f b i aɪ[TAB]FBI Etienne [TAB]eh-tee-en [TAB] [TAB]
DisplayAs [TAB]SoundsLike[TAB]IPA [TAB]Phrase Los Angeles[TAB] [TAB] [TAB]Los-Angeles FBI [TAB] [TAB]ɛ f b i aɪ[TAB]F.B.I. [TAB]eh-tee-en [TAB] [TAB]Etienne
  • 구절 – 인식되어야 하는 단어 또는 구절입니다.

    구절을 입력할 경우 단어는 하이픈(-)으로 구분합니다. 예를 들어 Los AngelesLos-Angeles로 입력합니다.

    머리글자어 또는 문자를 개별적으로 발음해야 하는 기타 단어는 점으로 구분된 단일 문자로 입력합니다(예: A.B.C. 또는 F.B.I.). 머리글자어의 복수 형태를 입력하려면(예: "ABCs") 하이픈을 사용해 머리글자어에서 "s"를 구분합니다(예: "A.B.C.-s"). 대문자 또는 소문자를 사용해 머리글자어를 입력할 수 있습니다. 두문자어를 지원하는 언어 목록은 목록을 사용하여 사용자 지정 어휘 만들기 단원을 참조하십시오.

    Phrase 필드는 필수입니다. 허용되는 모든 문자를 입력 언어로 사용할 수 있습니다. 허용되는 문자의 목록은 개별 언어를 참조하십시오. DisplayAs 필드를 지정하지 않으면 Amazon Transcribe에서 출력 파일에 Phrase 필드의 내용을 사용합니다.

  • IPA – 단어나 구절의 발음을 지정하려면 이 필드에 IPA(International Phonetic Alphabet)의 문자를 포함할 수 있습니다. IPA 필드에는 선행 또는 후행 공백을 포함할 수 없으며 입력에서 단일 공백을 사용하여 각 음소를 구분해야 합니다. 예를 들어 영어에서는 Los-Angeles 구절을 l ɔ s æ n ʤ ə l ə s의 형식으로 입력합니다. F.B.I. 구절은 ɛ f b i aɪ의 형식으로 입력합니다.

    IPA 필드의 내용을 지정하지 않으면 빈 IPA 필드를 포함해야 합니다. IPA 필드를 지정할 경우 SoundsLike 필드를 지정할 수 없습니다.

    특정 언어에서 허용되는 IPA 문자의 목록은 개별 언어의 테이블을 참조하십시오.

  • SoundsLike – 단어나 구절을 보다 작은 조각으로 분리하고 언어의 표준 철자법을 사용하여 각 조각의 발음을 제공하여 단어의 소리를 모방할 수 있습니다. 예를 들어 영어에서 Los-Angeles 구절에 대한 발음 힌트는 loss-ann-gel-es의 형식으로 제공할 수 있습니다. Etienne이라는 단어에 대한 힌트는 eh-tee-en의 형식으로 제공할 수 있습니다. 힌트의 각 부분은 하이픈(-)으로 구분합니다.

    SoundsLike 필드를 지정하지 않으면 빈 SoundsLike 필드를 포함해야 합니다. SoundsLike 필드를 지정할 경우 IPA 필드를 지정할 수 없습니다.

    허용되는 모든 문자를 입력 언어로 사용할 수 있습니다. 허용되는 문자의 목록은 개별 언어를 참조하십시오.

  • DisplayAs – 단어 또는 구절의 출력 시 모양을 정의합니다. 예를 들어 단어 또는 구절이 Los-Angeles일 경우 표시 형식을 "Los Angeles"로 지정하여 하이픈이 출력에 포함되지 않도록 할 수 있습니다.

    DisplayAs 필드를 지정하지 않으면 Amazon Transcribe에서 입력 파일의 Phrase 필드를 출력에 사용합니다.

    DisplayAs 필드에 UTF-8 문자를 사용할 수 있습니다.

사용자 지정 어휘의 문자 집합

Amazon Transcribe는 사용자 지정 어휘를 만드는 데 사용할 수 있는 문자를 제한합니다. 각 언어에 대해 다음과 같은 문자 집합을 사용할 수 있습니다.

아랍어 문자 집합

아랍어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 유니코드 문자를 사용할 수 있습니다. 하이픈(-) 문자를 사용하여 단어를 구분할 수도 있습니다.

문자 코드 문자 코드
ء 0621 س 0633
آ 0622 ش 0634
أ 0623 ص 0635
ؤ 0624 ض 0636
إ 0625 ط 0637
ئ 0626 ظ 0638
ا 0627 ع 0639
ب 0628 غ 063A
ة 0629 ف 0641
ت 062A ق 0642
ث 062B ك 0643
ج 062C ل 0644
ح 062D م 0645
خ 062E ن 0646
د 062F ه 0647
ذ 0630 و 0648
ر 0631 ى 0649
ز 0632 ي 064A

어휘 입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 0074 02E4
0061 02D0 u 0075
b 0062 0075 02D0
d 0064 v 0076
0064 02E4 w 0077
f 0066 x 0078
h 0068 z 007A
i 0069 007A 02E4
0069 02D0 ð 00F0
j 006A ðˤ 00F0 02E4
k 006B ħ 0127
l 006C ɣ 0263
m 006D ɪ 026A
n 006E ɫ 026B
p 0070 ʃ 0283
q 0071 ʒ 0292
r 0072 ʔ 0294
s 0073 ʕ 0295
0073 02E4 θ 03B8
t 0074 χ 03C7

중국어 문자 집합

중국어 사용자 정의 어휘의 경우, Phrase 필드는 GitHub의 다음 파일에 나열된 문자를 사용할 수 있습니다.

SoundsLike 필드에는 GitHub의 다음 파일에 나열된 병음 음절이 포함될 수 있습니다.

SoundsLike 필드에서 병음 음절을 사용하는 경우 하이픈(-)으로 음절을 구분합니다.

Amazon Transcribe는 숫자를 사용하여 표준 중국어의 4개 톤을 나타냅니다. 다음 표는 톤 표시가 “ma” 단어에 매핑되는 방법을 보여줍니다.

톤 표시 톤 번호
톤 1 mā ma1
톤 2 má ma2
톤 3 mǎ ma3
톤 4 mà ma4

중국어 사용자 지정 어휘는 IPA 필드를 사용하지 않지만 어휘 표에 IPA 헤더를 계속 포함시켜야 합니다.

다음은 텍스트 형식의 입력 파일 예입니다. 이 예제에서는 공백을 사용하여 열을 정렬합니다. 입력 파일은 TAB 문자를 사용하여 열을 구분해야 합니다. DisplayAs 열에 공백을 포함합니다.

Phrase SoundsLike IPA DisplayAs 康健 kang1-jian4 谴责 qian3-ze2 国防大臣 guo2-fang2-da4-chen2 世界博览会 shi4-jie4-bo4-lan3-hui4 世博会

네덜란드어 문자 집합

프랑스어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

PhraseSoundsLike 필드에 다음 유니코드 문자도 사용할 수 있습니다.

문자 코드 문자 코드
à 00E0 î 00EE
á 00E1 ï 00EF
â 00E2 ñ 00F1
ä 00E4 ò 00F2
ç 00E7 ó 00F3
è 00E8 ô 00F4
é 00E9 ö 00F6
ê 00EA ù 00F9
ë 00EB ú 00FA
ì 00EC û 00FB
í 00ED ü 00FC

어휘 입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a: 0061 003A z 007A
0062 02D0 ø: 00F8 003A
b 0062 ŋ 014B
d 0064 œy 0153 0079
0065 02D0 œː 0153 02D0
f 0066 ɑ 0251
g 0067 ɔ 0254
i 0069 ɔu 0254 0075
j 006A ɔː 0254 02D0
k 006B ə 0259
l 006C ɛ 025B
m 006D ɛ: 025B 003A
n 006E ɛi 025B 0069
006F 02D0 ɦ 0266
p 0070 ɪ 026A
s 0073 ɲ 0272
t 0074 ɾ 027E
u 0075 ʃ 0283
v 0076 ʏ 028F
w 0077 ʒ 0292
y 0079 χ 03C7

영어 문자 집합

영어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

어휘 입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
0061 028A w 0077
0061 026A z 007A
b 0062 æ 00E6
d 0064 ð 00F0
0065 026A ŋ 014B
f 0066 ɑ 0251
g 0067 ɔ 0254
h 0068 ɔɪ 0254 026A
i 0069 ə 0259
j 006A ɛ 025B
k 006B ɝ 025D
l 006C ɡ 0261
006C 0329 ɪ 026A
m 006D ɹ 0279
n 006E ʃ 0283
006E 0329 ʊ 028A
006F 028A ʌ 028C
p 0070 ʍ 028D
s 0073 ʒ 0292
t 0074 ʤ 02A4
u 0075 ʧ 02A7
v 0076 θ 03B8

페르시아어 문자 집합

페르시아어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

문자 코드 문자 코드
ء 0621 ظ 0638
آ 0622 ع 0639
أ 0623 غ 063A
ؤ 0624 ف 0641
ئ 0626 ق 0642
ا 0627 ل 0644
ب 0628 م 0645
ت 062A ن 0646
ث 062B ه 0647
ج 062C و 0648
ح 062D َ 064E
خ 062E ُ 064F
د 062F ِ 0650
ذ 0630 ّ 0651
ر 0631 پ 067E
ز 0632 چ 0686
س 0633 ژ 0698
ش 0634 ک 06A9
ص 0635 گ 06AF
ض 0636 ی 06CC
ط 0637    

어휘 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet)를 사용할 수 있습니다.

문자 코드 문자 코드
b 0062 u 0075
d 0064 v 0076
f 0066 z 007A
g 0067 æ 00E6
h 0068 ɒ 0252
i 0069 ɛ 025B
j 006A ɾ 027E
k 006B ʁ 0281
l 006C ʃ 0283
m 006D ʒ 0292
n 006E ʔ 0294
o 006F ʔ 0294
p 0070 ʤ 02A4
s 0073 ʧ 02A7
t 0074 χ 03C7

프랑스어 문자 집합

프랑스어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

PhraseSoundsLike 필드에 다음 유니코드 문자도 사용할 수 있습니다.

문자 코드 문자 코드
À 00C0 à 00E0
 00C2 â 00E2
Ç 00C7 ç 00E7
È 00C8 è 00E8
É 00C9 é 00E9
Ê 00CA ê 00EA
Ë 00CB ë 00EB
Î 00CE î 00EE
Ï 00CF ï 00EF
Ô 00D4 ô 00F4
Ö 00D6 ö 00F6
Ù 00D9 ù 00F9
Û 00DB û 00FB
Ü 00DC ü 00FC

어휘 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet)를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 z 007A
b 0062 ã 00E3
d 0064 õ 00F5
e 0065 ø 00F8
f 0066 ŋ 014B
i 0069 œ 0153
j 006A œ̃ 0153 0303
k 006B ɐ 0250
l 006C ɔ 0254
m 006D ə 0259
n 006E ɛ 025B
o 006F ɡ 0261
p 0070 ɥ 0265
s 0073 ɲ 0272
t 0074 ʁ 0281
u 0075 ʃ 0283
v 0076 ʒ 0292
w 0077 1EBD
y 0079    

독일어 문자 집합

독일어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

PhraseSoundsLike 필드에 다음 유니코드 문자도 사용할 수 있습니다.

문자 코드 문자 코드
ä 00E4 Ä 00C4
ö 00F6 Ö 00D6
ü 00FC Ü 00DC
ß 00DF    

어휘 입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 ts 0074 0073
0061 026A 0075 02D0
0061 028A v 0076
0061 02D0 x 0078
b 0062 z 007A
d 0064 0079 02D0
0065 02D0 ã 00E3
f 0066 ç 00E7
g 0067 øː 00F8 02D0
h 0068 ŋ 014B
0069 02D0 œ 0153
j 006A ɐ̯ 0250 032F
k 006B ɔ 0254
l 006C ɔʏ 0254 028F
006C 0329 ə 0259
m 006D ɛ 025B
006D 0329 ɛː 025B 02D0
n 006E ɪ 026A
006E 0329 ʁ 0281
006F 02D0 ʃ 0283
p 0070 ʊ 028A
pf 0070 0066 ʏ 028F
s 0073 ʧ 02A7
t 0074    

히브리어 문자 집합

히브리어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 유니코드 문자를 사용할 수 있습니다.

문자 코드 문자 코드
- 002D ם 05DD
א 05D0 מ 05DE
ב 05D1 ן 05DF
ג 05D2 נ 05E0
ד 05D3 ס 05E1
ה 05D4 ע 05E2
ו 05D5 ף 05E3
ז 05D6 פ 05E4
ח 05D7 ץ 05E5
ט 05D8 צ 05E6
י 05D9 ק 05E7
ך 05DA ר 05E8
כ 05DB ש 05E9
ל 05DC ת 05EA

어휘 입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 p 0070
b 0062 s 0073
d 0064 t 0074
e 0065 u 0075
f 0066 v 0076
g 0067 w 0077
h 0068 z 007A
i 0069 ŋ 014B
j 006A ɣ 0263
k 006B ʃ 0283
l 006C ʒ 0292
m 006D ʔ 0294
n 006E χ 03C7
o 006F    

힌디어 문자 집합

힌디어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 유니코드 문자를 사용할 수 있습니다.

문자 코드 문자 코드
- 002D 0925
. 002E 0926
0901 0927
0902 0928
0903 092A
0905 092B
0906 092C
0907 092D
0908 092E
0909 092F
090A 0930
090B 0932
090F 0935
0910 0936
0911 0937
0913 0938
0914 0939
0915 093E
0916 ि 093F
0917 0940
0918 0941
0919 0942
091A 0943
091B 0945
091C 0947
091D 0948
091E 0949
091F 094B
0920 094C
0921 094D
0922 095B
0923 095C
0924 095D

Amazon Transcribe는 다음 문자를 매핑합니다.

문자 매핑 대상
ऩ(0929) न(0928)
ऱ(0931) र(0930)
क़(0958) क(0915)
ख़(0959) ख(0916)
ग़(095A) ग(0917)
फ़(095E) फ(092B)
य़(095F) य(092F)

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
0097 0720 ŋ 0331
b 0098 ɖ 0598
0098 0689 ɔː 0596 0720
d 0100 ɖʱ 0598 0689
0100 0689 ə 0601
0101 0720 ɛː 0603 0720
f 0102 ɡ 0609
0105 0720 ɡʱ 0609 0689
j 0106 ɦ 0614
k 0107 ɪ 0618
0107 0688 ɲ 0626
l 0108 ɳ 0627
m 0109 ɾ 0638
n 0110 ʂ 0642
0111 0720 ʃ 0643
p 0112 ʈ 0648
0112 0688 ʈʰ 0648 0688
r 0114 ʊ 0650
s 0115 ʋ 0651
t 0116 ʤ 0676
0116 0688 ʤʱ 0676 0689
0117 0720 ʧ 0679
z 0122 ʧʰ 0679 0688

인도네시아어 문자 집합

인도네시아어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 r 0072
ai 0061 0069 s 0073
au 0061 0075 t 0074
b 0062 0074 0283
d 0064 u 0075
d 0064 v 0076
e 0065 w 0077
f 0066 x 0078
h 0068 y 0079
i 0069 ŋ 014B
j 006A ɔ 0254
k 006B ə 0259
l 006C ɛ 025B
m 006D ɡ 0261
n 006E ɣ 0263
o 006F ɪ 026A
oi̯ 006F 0069 032F ɲ 0272
p 0070 ʃ 0283
q 0071 ʊ 028A

이탈리아어 문자 집합

이탈리아어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

PhraseSoundsLike 필드에 다음 유니코드 문자도 사용할 수 있습니다.

문자 코드 문자 코드
À 00C0 à 00E0
Ä 00C4 ä 00E4
Ç 00C7 ç 00E7
È 00C8 è 00E8
É 00C9 é 00E9
Ê 00CA ê 00EA
Ë 00CB ë 00EB
Ì 00CC ì 00EC
Ò 00D2 ò 00F2
Ù 00D9 ù 00F9
Ü 00DC ü 00FC

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 ss 0073 0073
b 0062 t 0074
bb 0062 0062 tt 0074 0074
d 0064 u 0075
dd 0064 0064 v 0076
e 0065 vv 0076 0076
f 0066 w 0077
ff 0066 0066 z 007A
gg 0067 0067 ɔ 0254
i 0069 ɛ 025B
j 006A ɡ 0261
k 006B ɲ 0272
kk 006B 006B ɲɲ 0272 0272
l 006C ʃ 0283
ll 006C 006C ʃʃ 0283 0283
m 006D ʎ 028E
mm 006D 006D ʎʎ 028E 028E
n 006E ʣ 02A3
nn 006E 006E ʣʣ 02A3 02A3
o 006F ʤ 02A4
p 0070 ʤʤ 02A4 02A4
pp 0070 0070 ʦ 02A6
r 0072 ʦʦ 02A6 02A6
rr 0072 0072 ʧ 02A7
s 0073 ʧʧ 02A7 02A7

일본어 문자 집합

일본어 사용자 지정 어휘의 경우, PhraseDisplayAs 필드는 GitHub의 다음 파일에 나열된 문자를 사용할 수 있습니다.

Amazon Transcribe는 SoundsLike 필드에서 일본어 로마자를 지원합니다. 다음과 같은 소문자를 사용할 수 있습니다.

  • a - k

  • m - p

  • r - w

  • y - z

모음을 이중으로 사용하여 장모음을 표시합니다.

모음 표시
ā aa
- ee
ī ii
ō oo
ū uu

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 p 0070
0061 02D0 s 0073
b 0062 t 0074
d 0064 ts 0074 0073
dz 0064 007A 0074 0255
0064 0291 w 0077
e 0065 z 007A
0065 02D0 ç 00E7
g 0067 ŋ 014B
h 0068 ɕ 0255
i 0069 ɯ 026F
0069 02D0 ɯː 026F 02D0
j 006A ɴ 0274
k 006B ɸ 0278
m 006D ɾ 027E
n 006E ʑ 0291
o 006F ʔ 0294
006F 02D0    

한국어 문자 집합

한국어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 모든 한글 음절을 사용할 수 있습니다. 자세한 내용은 Wikipedia의 Hangul Syllables를 참조하십시오.

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 00061 0073 0348
e 00065 t 0074
h 00068 0074 0255
i 00069 tɕʰ 0074 0255 02B0
je 006A 0065 0074 02B0
jo 006A 006F 0074 0348
ju 006A 0075 t͈ɕ 0074 0348 0255
006A 025B u 0075
006A 028C we 0077 0065
ja 006A 0061 wi 0077 0069
k 006B 0077 025B
006B 02B0 0077 028C
006B 0348 wa 0077 0061
l 006C ø 00F8
m 006D ŋ 0014B
n 006E ɛ 0025B
o 006F ɯ 026F
p 0070 ɯi 006F 0069
0070 02B0 ɾ 027E
0070 0348 ʌ 028C
s 0073    

말레이어 문자 집합

말레이어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
F 0046 r 0072
a 0061 s 0073
ai 0061 0069 t 0074
au 0061 0075 0074 0283
b 0062 v 0076
d 0064 w 0077
0064 0292 x 0078
e 0065 y 0079
h 0068 ŋ 014B
i 0069 ɔ 0254
j 006A ə 0259
k 006B ɛ 025B
l 006C ɡ 0261
m 006D ɣ 0263
n 006E ɪ 026A
o 006F ɲ 0272
oi̯ 006F 0069 32F ʃ 0283
p 0070 ʊ 028A
q 0071 ʊi 028A 0069

포르투갈어 문자 집합

포르투갈어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

PhraseSoundsLike 필드에 다음 유니코드 문자도 사용할 수 있습니다.

문자 코드 문자 코드
À 00C0 à 00E0
Á 00C1 á 00E1
 00C2 â 00E2
à 00C3 ã 00E3
Ä 00C4 ä 00E4
Ç 00C7 ç 00E7
È 00C8 è 00E8
É 00C9 é 00E9
Ê 00CA ê 00EA
Ë 00CB ë 00EB
Í 00CD í 00ED
Ñ 00D1 ñ 00F1
Ó 00D3 ó 00F3
Ô 00D4 ô 00F4
Õ 00D5 õ 00F5
Ö 00D6 ö 00F6
Ú 00DA ú 00FA
Ü 00DC ü 00FC

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 v 0076
b 0062 w 0077
d 0064 0077 0303
e 0065 z 007A
f 0066 õ 00F5
g 0067 ĩ 00129
i 0069 ũ 00169
j 006A ɐ̃ 0250 0303
k 006B ɔ 0254
l 006C ɛ 025B
m 006D ɲ 0272
n 006E ɾ 027E
o 006F ʁ 0281
p 0070 ʃ 0283
s 0073 ʎ 028E
t 0074 ʒ 0292
0074 0283 ʤ 02A4
u 0075 1EBD

러시아어 문자 집합

러시아어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

문자 코드 문자 코드
' 0027 п 043F
- 002D р 0440
. 002E с 0441
а 0430 т 0442
б 0431 у 0443
в 0432 ф 0444
г 0433 х 0445
д 0434 ц 0446
е 0435 ч 0447
ж 0436 ш 0448
з 0437 щ 0449
и 0438 ъ 044A
й 0439 ы 044B
к 043A ь 044C
л 043B э 044D
м 043C ю 044E
н 043D я 044F
о 043E ё 0451

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
b 0062 t 0074
0062 02B2 0074 0283
d 0064 0074 02B2
0064 02B2 u 0075
f 0066 v 0076
0066 02B2 0076 02B2
g 0067 x 0078
067 02B2 0078 02B2
i 0069 z 007A
j 006A 007A 02B2
k 006B æ 00E6
006B 02B2 ə 0259
l 006C ɛ 025B
006C 02B2 ɨ 0268
m 006D ʃ 0283
006D 02B2 ʃʲ 0283 02B2
n 006E ʊ 028A
006E 02B2 ʌ 028C
p 0070 ʒ 0292
0070 02B2 ˈi 02C8 0069
r 0072 ˈo 02C8 006F
0072 02B2 ˈv 02C8 0075
s 0073 ˈɛ 02C8 025B
0073 02B2 ˈɨ 02C8 0268
ts 0074 0073 ˈa 02C8 0061

스페인어 문자 집합

스페인어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

PhraseSoundsLike 필드에 다음 유니코드 문자도 사용할 수 있습니다.

문자 코드 문자 코드
Á 00C1 á 00E1
É 00C9 é 00E9
Í 00CD ë 00ED
Ó 00D3 ó 0XF3
Ú 00DA ú 00FA
Ñ 00D1 ñ 0XF1
ü 00FC    

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 r 0072
b 0062 s 0073
d 0064 t 0074
e 0065 u 0075
f 0066 v 0076
g 0067 w 0077
h 0068 x 0078
i 0069 z 007A
j 006A ŋ 014B
k 006B ɲ 0272
l 006C ɾ 027E
m 006D ʃ 0283
n 006E ʝ 029D
o 006F ʧ 02A7
p 0070 θ 03B8

타밀어 문자 집합

타밀어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

문자 코드 문자 코드
0B85 0BB0
0B86 0BB2
0B87 0BB5
0B88 0BB4
0B89 0BB3
0B8A 0BB1
0B8E 0BA9
0B8F 0B9C
0B90 0BB6
0B92 0BB7
0B93 0BB8
0B94 0BB9
0B83 0BCD
0B95 0BBE
0B99 ி 0BBF
0B9A 0BC0
0B9E 0BC1
0B9F 0BC2
0BA3 0BC6
0BA4 0BC7
0BA8 0BC8
0BAA 0BCA
0BAE 0BCB
0BAF 0BCC

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 v 0076
0061 02D0 w 0077
b 0062 z 007A
d 0064 æ 00E6
0064 0292 ð 00F0
e 0065 ŋ 014B
f 0066 ɑ 0251
g 0067 ɔ 0254
h 0068 ə 0259
i 0069 ɛ 025B
0069 02D0 ɡ 0261
j 006A ɪ 026A
k 006B ɭ 026D
l 006C ɲ 0272
m 006D ɳ 0273
n 006E ɹ 0279
006E 032A ɹ 0279
o 006F ɹ̩ 0279 0329
006F 02D0 ɾ 027E
p 0070 ʂ 0282
r 0072 ʃ 0283
s 0073 ʈ 0288
t 0074 ʊ 028A
0074 032A ʋ 028B
0074 0283 ʌ 028C
u 0075 ʒ 0292
0075 02D0 θ 03B8

텔루구어 문자 집합

텔루구어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

문자 코드 문자 코드
- 002D 0C24
0C01 0C25
0C02 0C26
0C03 0C27
0C05 0C28
0C06 0C2A
0C07 0C2B
0C08 0C2C
0C09 0C2D
0C0A 0C2E
0C0B 0C2F
0C0C 0C30
0C0E 0C31
0C0F 0C32
0C10 0C33
0C12 0C35
0C13 0C36
0C14 0C37
0C15 0C38
0C16 0C39
0C17 0C3E
0C18 ి 0C3F
0C19 0C40
0C1A 0C41
0C1B 0C42
0C1C 0C43
0C1D 0C44
0C1E 0C47
0C1F 0C48
0C20 0C4A
0C21 0C4B
0C22 0C4C
0C23 0C4D

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
0064 032A ð 00F0
d̪̤ 0064 032A 0324 ŋ 014B
0064 0292 ɑ 0251
dʒ̤ 0064 0292 0324 ɔ 0254
e 0065 ɖ 0256
0065 02D0 ɖ̤ 0256 0324
f 0066 ə 0259
h 0068 ɛ 025B
i 0069 ɡ 0261
0069 0290 ɡ̤ 0261 0324
j 006A ɪ 026A
k 006B ɭ 026D
006B 02B0 ɲ 0272
l 006C ɳ 0273
m 006D ɹ 0279
n 006E ɹ̩ 0279 0329
o 006F ɽ 027D
006F 02D0 ʂ 0282
p 0070 ʃ 0283
0070 02B0 ʈ 0288
r 0072 ʈʰ 0288 02B0
s 0073 ʊ 028A
t 0074 ʋ 028B
0074 032A ʌ 028C
t̪ʰ 0074 032A 02B0 ʒ 0292
t 0074 θ 03B8
tʃʰ 0074 0283 02B0    

터키어 문자 집합

터키어 사용자 지정 어휘의 경우 PhraseSoundsLike 필드에 다음 문자를 사용할 수 있습니다.

  • a - z

  • A - Z

  • ' (아포스트로피)

  • - (하이픈)

  • . (마침표)

PhraseSoundsLike 필드에 다음 유니코드 문자도 사용할 수 있습니다.

문자 코드 문자 코드
Ç 00C7 ö 00F6
Ö 00D6 û 00FB
Ü 00DC ü 00FC
â 00E2 Ğ 011E
ä 00E4 ğ 011F
ç 00E7 İ 0130
è 00E8 ı 0131
é 00E9 Ş 015E
ê 00EA ş 015F
í 00ED š 0161
î 00EE ž 017E
ó 00F3    

입력 파일의 IPA 필드에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.

문자 코드 문자 코드
a 0061 u 0075
0061 02D0 0075 02D0
b 0062 v 0076
c 0063 w 0077
d 0064 y 0079
e 0065 0079 02D0
0065 02D0 z 007A
f 0066 ø 00F8
g 0067 øː 00F8 02D0
h 0068 ŋ 014B
i 0069 ɟ 025F
0069 02D0 ɣ 0263
j 006A ɫ 026B
k 006B ɯ 026F
l 006C ɯː 026F 02D0
m 006D ɾ 027E
n 006E ʃ 0283
o 006F ʒ 0292
006F 02D0 ʔ 0294
p 0070 ʤ 02A4
s 0073 ʧ 02A7
t 0074