カスタム語彙 - Amazon Transcribe

英語の翻訳が提供されている場合で、内容が矛盾する場合には、英語版がオリジナルとして取り扱われます。翻訳は機械翻訳により提供されています。

カスタム語彙

カスタム語彙を作成して、入力ファイルの音声を処理する方法について Amazon Transcribe により詳細な情報を与えることができます。カスタム語彙は、オーディオ入力で Amazon Transcribe に認識させたい特別な語句のリストです。これらは通常、Amazon Transcribe が認識しないドメイン固有の語句や適切な名詞です。

カスタム語彙は、特定の単語や句をターゲットにしている場合に最も効果的です。1 つの語彙に多数の単語を含めてすべての録音に使用するのではなく、特定の音声記録に合わせて、小さな語彙をそれぞれ作成することをお勧めします。最大 100 の語彙をアカウントに登録することができます。カスタム語彙のサイズは 50 KB に制限されています。

カスタム語彙をテキストファイルで指定します。語彙に単語のリストを指定するか、カスタムの語彙の単語の入力と出力を詳細に制御できる 4 列のテーブルを指定できます。

カスタム語彙の作成の詳細については、「リストを使用してカスタム語彙を作成する」および「テーブルを使用してカスタム語彙を作成する」を参照してください。

カスタム語彙を作成するには、CreateVocabulary オペレーションまたは Amazon Transcribe コンソールを使用します。CreateVocabulary リクエストを送信すると、Amazon Transcribe が語彙を処理します。語彙の処理状況を表示するには、コンソールまたは GetVocabulary オペレーションを使用します。

注記

Amazon Transcribe コンソールを使用してカスタム語彙をアップロードする場合は、語彙テーブルの代わりに語彙リストを使用する必要があります。コンソールを使用してカスタム語彙を語彙テーブルで作成するには、ソースファイルが Amazon S3 バケットに存在する必要があります。

カスタム語彙を使用するには、StartTranscriptionJob オペレーションを呼び出す際に Settings フィールドの VocabularyName フィールドを設定するか、文字起こしジョブの作成時にコンソールで語彙を選択します。

リストを使用してカスタム語彙を作成する

カスタム語彙は、テキストファイル内の単語または句のリストを使用して作成できます。各単語をそれぞれ独自の行に配置するか、1 行に複数の単語を配置して単語または句をカンマで区切ることができます。

エントリには次のような指定があります。

  • 256 文字未満 (ハイフンを含む)

  • 使用文字セットの文字のみ

有効な文字セットの詳細については、「カスタム語彙の文字セット」を参照してください。

エントリが句のリストである場合は、その句の単語をハイフンで区切ります。たとえば、句が Los Angeles の場合は、Los-Angeles とファイルに入力します。

頭字語、またはドットで区切られた文字として個別に発音する必要があるその他の単語 (例: A.B.C.F.B.I.) を入力します。「ABC」のように複数形の頭字語を入力するには、「s」と頭字語をハイフンで区切ります: 「A.B.C.-s」。頭字語の入力には、大文字と小文字のどちらでも使用できます。頭字語は、次の言語でサポートされています。

  • オランダ語

  • すべての英語変種

  • すべてのフランス語変種

  • すべてのドイツ語変種

  • ヒンディー語

  • インドネシア語

  • イタリア語

  • マレー語

  • すべてのポルトガル語変種

  • すべてのスペイン語変種

  • トルコ語

次の例は、単語と句が別々の行にある入力ファイルを示しています。

Los-Angeles F.B.I. Etienne

次の例は、単語と句をカンマで区切り 1 行にした入力ファイルを示しています。

Los-Angeles,F.B.I.,Etienne

テーブルを使用してカスタム語彙を作成する

カスタム語彙を作成するには、テキストファイルでテーブルを作成します。テーブルの各行は、単語または句に、IPASoundsLike、および DisplayAs フィールドが続きます。各フィールドには、以下を含みます。

  • 256 文字未満 (ハイフンを含む)

  • 使用文字セットの文字のみ

有効な文字セットの詳細については、「カスタム語彙の文字セット」を参照してください。

各単語または句はテキストファイルで個別の行に配置します。フィールドを TAB 文字で区切ります。このファイルは、拡張子 .txt で、API を呼び出しているのと同じリージョンの Amazon S3 バケットに保存します。

以下の例はテキスト形式の入力ファイルです。この例では、スペースを使用して列を揃えています。入力ファイルでは、TAB 文字を使用して列を区切る必要があります。IPA 列と DisplayAs 列にのみスペースを含めます。これらの例をコピーする場合、列間の余分なスペースを削除し、「[TAB]」を TAB 文字に置き換えます。

Phrase [TAB]IPA [TAB]SoundsLike[TAB]DisplayAs Los-Angeles[TAB] [TAB] [TAB]Los Angeles F.B.I. [TAB]ɛ f b i aɪ[TAB] [TAB]FBI Etienne [TAB] [TAB]eh-tee-en [TAB]

列は、任意の順序で入力できます。また、カスタム語彙の入力ファイルの有効な構造を以下に示します。

Phrase [TAB]SoundsLike[TAB]IPA [TAB]DisplayAs Los-Angeles[TAB] [TAB] [TAB]Los Angeles F.B.I [TAB] [TAB]ɛ f b i aɪ[TAB]FBI Etienne [TAB]eh-tee-en [TAB] [TAB]
DisplayAs [TAB]SoundsLike[TAB]IPA [TAB]Phrase Los Angeles[TAB] [TAB] [TAB]Los-Angeles FBI [TAB] [TAB]ɛ f b i aɪ[TAB]F.B.I. [TAB]eh-tee-en [TAB] [TAB]Etienne
  • – 認識する必要がある単語または句。

    エントリが句の場合、単語はハイフン (-) で区切ります。たとえば、Los AngelesLos-Angeles と入力します。

    頭字語、または文字が単一の文字とそれに続くドットとして個別に発音される必要があるその他の単語 (例: A.B.C.F.B.I.) を入力します。「ABC」のように複数形の頭字語を入力するには、「s」と頭字語をハイフンで区切ります: 「A.B.C.-s」。頭字語の入力には、大文字と小文字のどちらでも使用できます。頭字語をサポートする言語のリストについては、「リストを使用してカスタム語彙を作成する」を参照してください。

    Phrase フィールドは必須です。入力言語として許可されている文字はいずれも使用できます。使用できる文字のリストについては、個々の言語を参照してください。DisplayAs フィールドを指定しない場合は、Amazon Transcribe によって、Phrase のコンテンツが出力ファイルに使用されます。

  • IPA – 単語または句の発音を指定するには、国際音声記号 (IPA) の文字をこのフィールドに使用することができます。IPA フィールドには、先頭または末尾にスペースを含めることはできません。また、入力の phoneme を区切るには、1 つのスペースを使用する必要があります。たとえば、英語で Los-Angelesl ɔ s æ n ʤ ə l ə s と入力したとします。F.B.I. には ɛ f b i aɪ と入力します。

    IPA フィールドの内容を指定しない場合は、IPA フィールドに空白を含める必要があります。IPA フィールドを指定した場合は、SoundsLike フィールドを指定することはできません。

    特定の言語で許可されている IPA 文字のリストについては、各言語のテーブルを参照してください。

  • SoundsLike – 単語や句を小さく分割し、言語の標準的な正書法を使用して各語の発音を指定することで、単語の発音方法を模倣することができます。たとえば、英語で Los-Angeles 句の発音ヒントは loss-ann-gel-es のように指定することができます。単語のヒント Etienneeh-tee-en のようになります。ヒントの各部分はハイフン (-) を使って区切ります。

    SoundsLike フィールドを指定しない場合は、SoundsLike フィールドに空白を含める必要があります。SoundsLike フィールドを指定した場合は、IPA フィールドを指定することはできません。

    入力言語として許可されている文字はいずれも使用できます。使用できる文字のリストについては、個々の言語を参照してください。

  • DisplayAs – 単語または句を出力する際の表示を定義します。たとえば、単語または句が Los-Angeles の場合は、ハイフンが出力に表示されないように、「Los Angeles」という形式で表示されるよう指定することができます。

    DisplayAs フィールドを指定しない場合は、Amazon Transcribe によって、入力ファイルの Phrase フィールドが出力ファイルに使用されます。

    UTF-8 文字はいずれも、DisplayAs フィールドで使用することができます。

カスタム語彙の文字セット

Amazon Transcribe では、カスタム語彙の作成に使用できる文字が制限されています。各言語には、次の文字セットを使用できます。

アラビア語文字セット

アラビア語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の Unicode 文字を使用できます。ハイフン (-) を使用して単語を区切ることもできます。

文字 コード 文字 コード
ء 0621 س 0633
آ 0622 ش 0634
أ 0623 ص 0635
ؤ 0624 ض 0636
إ 0625 ط 0637
ئ 0626 ظ 0638
ا 0627 ع 0639
ب 0628 غ 063A
ة 0629 ف 0641
ت 062A ق 0642
ث 062B ك 0643
ج 062C ل 0644
ح 062D م 0645
خ 062E ن 0646
د 062F ه 0647
ذ 0630 و 0648
ر 0631 ى 0649
ز 0632 ي 064A

語彙入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 0074 02E4
0061 02D0 u 0075
b 0062 0075 02D0
d 0064 v 0076
0064 02E4 w 0077
f 0066 x 0078
h 0068 z 007A
i 0069 02E4 007A
0069 02D0 ð 00F0
j 006A ðˤ 00F0 02E4
k 006B ħ 0127
I 006C ɣ 0263
m 006D ɪ 026A
n 006E ɫ 026B
p 0070 ʃ 0283
q 0071 ʒ 0292
r 0072 ʔ 0294
s 0073 ʕ 0295
0073 02E4 θ 03B8
t 0074 χ 03C7

中国語文字セット

中国語のカスタム語彙の場合、Phrase フィールドには、GitHub の以下のファイルに一覧表示されている任意の文字を使用できます。

SoundsLike フィールドには、GitHub の以下のファイルに一覧表示されているピンイン音節を含めることができます。

SoundsLike フィールドにピンイン音節を使用する場合、音節をハイフン (-) で区切ります。

Amazon Transcribe では、数字を使用して中国語の 4 つの声調を表します。以下の表では、「ma」という単語に対応する声調記号を示しています。

声調 声調記号 声調番号
Tone 1 mā ma1
Tone 2 má ma2
Tone 3 mǎ ma3
Tone 4 mà ma4

中国語のカスタム語彙の場合、IPA フィールドを使用しませんが、語彙テーブルに IPA ヘッダーを含める必要があります。

テキスト形式の入力ファイルの例を以下に示します。この例では、スペースを使用して列を揃えています。入力ファイルでは、TAB 文字を使用して列を区切る必要があります。DisplayAs 列にのみスペースを含めます。

Phrase SoundsLike IPA DisplayAs 康健 kang1-jian4 谴责 qian3-ze2 国防大臣 guo2-fang2-da4-chen2 世界博览会 shi4-jie4-bo4-lan3-hui4 世博会

オランダ語文字セット

オランダ語のカスタム語彙の場合、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

以下の Unicode 文字を Phrase フィールドおよび SoundsLike フィールドで使用することもできます。

文字 コード 文字 コード
à 00E0 î 00EE
á 00E1 ï 00EF
â 00E2 ñ 00F1
ä 00E4 ò 00F2
ç 00E7 ó 00F3
è 00E8 ô 00F4
é 00E9 ö 00F6
ê 00EA ù 00F9
ë 00EB ú 00FA
ì 00EC û 00FB
í 00ED ü 00FC

語彙入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a: 0061 003A z 007A
0062 02D0 ø: 00F8 003A
b 0062 ŋ 014B
d 0064 œy 0153 0079
0065 02D0 œː 0153 02D0
f 0066 ɑ 0251
Amazon EC2 のセキュリティグループ 0067 ɔ 0254
i 0069 ɔu 0254 0075
j 006A ɔː 0254 02D0
k 006B ə 0259
I 006C ɛ 025B
m 006D ɛ: 025B 003A
n 006E ɛi 025B 0069
006F 02D0 ɦ 0266
p 0070 ɪ 026A
s 0073 ɲ 0272
t 0074 ɾ 027E
u 0075 ʃ 0283
v 0076 ʏ 028F
w 0077 ʒ 0292
y 0079 χ 03C7

英語の文字セット

英語のカスタム語彙の場合、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

語彙入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
0061 028A w 0077
0061 026A z 007A
b 0062 æ 00E6
d 0064 ð 00F0
0065 026A ŋ 014B
f 0066 ɑ 0251
Amazon EC2 のセキュリティグループ 0067 ɔ 0254
h 0068 ɔɪ 0254 026A
i 0069 ə 0259
j 006A ɛ 025B
k 006B ɝ 025D
I 006C ɡ 0261
006C 0329 ɪ 026A
m 006D ɹ 0279
n 006E ʃ 0283
006E 0329 ʊ 028A
006F 028A ʌ 028C
p 0070 ʍ 028D
s 0073 ʒ 0292
t 0074 ʤ 02A4
u 0075 ʧ 02A7
v 0076 θ 03B8

ペルシャ語文字セット

ペルシャ語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

文字 コード 文字 コード
ء 0621 ظ 0638
آ 0622 ع 0639
أ 0623 غ 063A
ؤ 0624 ف 0641
ئ 0626 ق 0642
ا 0627 ل 0644
ب 0628 م 0645
ت 062A ن 0646
ث 062B ه 0647
ج 062C و 0648
ح 062D َ 064E
خ 062E ُ 064F
د 062F ِ 0650
ذ 0630 ّ 0651
ر 0631 پ 067E
ز 0632 چ 0686
س 0633 ژ 0698
ش 0634 ک 06A9
ص 0635 گ 06AF
ض 0636 ی 06CC
ط 0637    

語彙ファイルの IPA フィールドには、以下の国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
b 0062 u 0075
d 0064 v 0076
f 0066 z 007A
Amazon EC2 のセキュリティグループ 0067 æ 00E6
h 0068 ɒ 0252
i 0069 ɛ 025B
j 006A ɾ 027E
k 006B ʁ 0281
I 006C ʃ 0283
m 006D ʒ 0292
n 006E ʔ 0294
006F ʔ 0294
p 0070 ʤ 02A4
s 0073 ʧ 02A7
t 0074 χ 03C7

フランス語キャラクタセット

フランス語のカスタム語彙の場合、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

以下の Unicode 文字を Phrase フィールドおよび SoundsLike フィールドで使用することもできます。

文字 コード 文字 コード
À 00C0 à 00E0
 00C2 â 00E2
Ç 00C7 ç 00E7
È 00C8 è 00E8
É 00C9 é 00E9
Ê 00CA ê 00EA
Ë 00CB ë 00EB
Î 00CE î 00EE
Ï 00CF ï 00EF
Ô 00D4 ô 00F4
Ö 00D6 ö 00F6
Ù 00D9 ù 00F9
Û 00DB û 00FB
Ü 00DC ü 00FC

語彙ファイルの IPA フィールドには、以下の国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 z 007A
b 0062 ã 00E3
d 0064 õ 00F5
e 0065 ø 00F8
f 0066 ŋ 014B
i 0069 œ 0153
j 006A œ̃ 0153 0303
k 006B ɐ 0250
I 006C ɔ 0254
m 006D ə 0259
n 006E ɛ 025B
006F ɡ 0261
p 0070 ɥ 0265
s 0073 ɲ 0272
t 0074 ʁ 0281
u 0075 ʃ 0283
v 0076 ʒ 0292
w 0077 1EBD
y 0079    

ドイツ語文字セット

ドイツ語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

以下の Unicode 文字を Phrase フィールドおよび SoundsLike フィールドで使用することもできます。

文字 コード 文字 コード
ä 00E4 Ä 00C4
ö 00F6 Ö 00D6
ü 00FC Ü 00DC
ß 00DF    

語彙入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 ts 0074 0073
0061 026A 0075 02D0
0061 028A v 0076
0061 02D0 x 0078
b 0062 z 007A
d 0064 0079 02D0
0065 02D0 ã 00E3
f 0066 ç 00E7
Amazon EC2 のセキュリティグループ 0067 øː 00F8 02D0
h 0068 ŋ 014B
0069 02D0 œ 0153
j 006A ɐ̯ 0250 032F
k 006B ɔ 0254
I 006C ɔʏ 0254 028F
006C 0329 ə 0259
m 006D ɛ 025B
006D 0329 ɛː 025B 02D0
n 006E ɪ 026A
006E 0329 ʁ 0281
006F 02D0 ʃ 0283
p 0070 ʊ 028A
pf 0070 0066 ʏ 028F
s 0073 ʧ 02A7
t 0074    

ヘブライ語文字セット

ヘブライ語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

文字 コード 文字 コード
- 002D ם 05DD
א 05D0 מ 05DE
ב 05D1 ן 05DF
ג 05D2 נ 05E0
ד 05D3 ס 05E1
ה 05D4 ע 05E2
ו 05D5 ף 05E3
ז 05D6 פ 05E4
ח 05D7 ץ 05E5
ט 05D8 צ 05E6
י 05D9 ק 05E7
ך 05DA ר 05E8
כ 05DB ש 05E9
ל 05DC ת 05EA

語彙入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 p 0070
b 0062 s 0073
d 0064 t 0074
e 0065 u 0075
f 0066 v 0076
Amazon EC2 のセキュリティグループ 0067 w 0077
h 0068 z 007A
i 0069 ŋ 014B
j 006A ɣ 0263
k 006B ʃ 0283
I 006C ʒ 0292
m 006D ʔ 0294
n 006E χ 03C7
006F    

ヒンディー語の文字セット

ヒンディー語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

文字 コード 文字 コード
- 002D 0925
. 002E 0926
0901 0927
0902 0928
0903 092A
0905 092B
0906 092C
0907 092D
0908 092E
0909 092F
090A 0930
090B 0932
090F 0935
0910 0936
0911 0937
0913 0938
0914 0939
0915 093E
0916 ि 093F
0917 0940
0918 0941
0919 0942
091A 0943
091B 0945
091C 0947
091D 0948
091E 0949
091F 094B
0920 094C
0921 094D
0922 095B
0923 095C
0924 095D

Amazon Transcribe は以下の文字をマッピングします。

文字 マッピング先
ऩ (0929) न (0928)
ऱ (0931) र (0930)
क़ (0958) क (0915)
ख़ (0959) ख (0916)
ग़ (095A) ग (0917)
फ़ (095E) फ (092B)
य़ (095F) य (092F)

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
0097 0720 ŋ 0331
b 0098 ɖ 0598
0098 0689 ɔː 0596 0720
d 0100 ɖʱ 0598 0689
0100 0689 ə 0601
0101 0720 ɛː 0603 0720
f 0102 ɡ 0609
0105 0720 ɡʱ 0609 0689
j 0106 ɦ 0614
k 0107 ɪ 0618
0107 0688 ɲ 0626
I 0108 ɳ 0627
m 0109 ɾ 0638
n 0110 ʂ 0642
0111 0720 ʃ 0643
p 0112 ʈ 0648
0112 0688 ʈʰ 0648 0688
r 0114 ʊ 0650
s 0115 ʋ 0651
t 0116 ʤ 0676
0116 0688 ʤʱ 0676 0689
0117 0720 ʧ 0679
z 0122 ʧʰ 0679 0688

インドネシア語文字セット

インドネシア語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 r 0072
ai 0061 0069 s 0073
au 0061 0075 t 0074
b 0062 0074 0283
d 0064 u 0075
d 0064 v 0076
e 0065 w 0077
f 0066 x 0078
h 0068 y 0079
i 0069 ŋ 014B
j 006A ɔ 0254
k 006B ə 0259
I 006C ɛ 025B
m 006D ɡ 0261
n 006E ɣ 0263
006F ɪ 026A
oi̯ 006F 0069 032F ɲ 0272
p 0070 ʃ 0283
q 0071 ʊ 028A

イタリア語文字セット

イタリア語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

以下の Unicode 文字を Phrase フィールドおよび SoundsLike フィールドで使用することもできます。

文字 コード 文字 コード
À 00C0 à 00E0
Ä 00C4 ä 00E4
Ç 00C7 ç 00E7
È 00C8 è 00E8
É 00C9 é 00E9
Ê 00CA ê 00EA
Ë 00CB ë 00EB
Ì 00CC ì 00EC
Ò 00D2 ò 00F2
Ù 00D9 ù 00F9
Ü 00DC ü 00FC

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 ss 0073 0073
b 0062 t 0074
bb 0062 0062 tt 0074 0074
d 0064 u 0075
dd 0064 0064 v 0076
e 0065 vv 0076 0076
f 0066 w 0077
ff 0066 0066 z 007A
gg 0067 0067 ɔ 0254
i 0069 ɛ 025B
j 006A ɡ 0261
k 006B ɲ 0272
kk 006B 006B ɲɲ 0272 0272
I 006C ʃ 0283
ll 006C 006C ʃʃ 0283 0283
m 006D ʎ 028E
mm 006D 006D ʎʎ 028E 028E
n 006E ʣ 02A3
nn 006E 006E ʣʣ 02A3 02A3
006F ʤ 02A4
p 0070 ʤʤ 02A4 02A4
pp 0070 0070 ʦ 02A6
r 0072 ʦʦ 02A6 02A6
rr 0072 0072 ʧ 02A7
s 0073 ʧʧ 02A7 02A7

日本語文字セット

日本語のカスタム語彙の場合、Phrase および DisplayAs フィールドには、GitHub の以下のファイルに一覧表示されている任意の文字を使用できます。

Amazon Transcribe では、SoundsLike フィールドでローマ字がサポートされています。次の小文字を使用できます。

  • a~k

  • m~p

  • r~w

  • y~z

母音を重ねて長母音を表します。

母音 表記
ā aa
ē ee
ī ii
ō oo
ū uu

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 p 0070
0061 02D0 s 0073
b 0062 t 0074
d 0064 ts 0074 0073
dz 0064 007A 0074 0255
0064 0291 w 0077
e 0065 z 007A
0065 02D0 ç 00E7
Amazon EC2 のセキュリティグループ 0067 ŋ 014B
h 0068 ɕ 0255
i 0069 ɯ 026F
0069 02D0 ɯː 026F 02D0
j 006A ɴ 0274
k 006B ɸ 0278
m 006D ɾ 027E
n 006E ʑ 0291
006F ʔ 0294
006F 02D0    

韓国語文字セット

韓国語のカスタム語彙の場合は、ハングル音節文字のいずれも、Phrase フィールドおよび SoundsLike フィールドで使用することができます。詳細については、Wikipedia の「ハングル音節文字」を参照してください。

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 00061 0073 0348
e 00065 t 0074
h 00068 0074 0255
i 00069 tɕʰ 0074 0255 02B0
je 006A 0065 0074 02B0
jo 006A 006F 0074 0348
ju 006A 0075 t͈ɕ 0074 0348 0255
006A 025B u 0075
006A 028C we 0077 0065
ja 006A 0061 wi 0077 0069
k 006B 0077 025B
006B 02B0 0077 028C
006B 0348 wa 0077 0061
I 006C ø 00F8
m 006D ŋ 0014B
n 006E ɛ 0025B
006F ɯ 026F
p 0070 ɯi 006F 0069
0070 02B0 ɾ 027E
0070 0348 ʌ 028C
s 0073    

マレー語文字セット

マレー語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
F 0046 r 0072
a 0061 s 0073
ai 0061 0069 t 0074
au 0061 0075 0074 0283
b 0062 v 0076
d 0064 w 0077
0064 0292 x 0078
e 0065 y 0079
h 0068 ŋ 014B
i 0069 ɔ 0254
j 006A ə 0259
k 006B ɛ 025B
I 006C ɡ 0261
m 006D ɣ 0263
n 006E ɪ 026A
006F ɲ 0272
oi̯ 006F 0069 32F ʃ 0283
p 0070 ʊ 028A
q 0071 ʊi 028A 0069

ポルトガル語キャラクタセット

ポルトガル語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

以下の Unicode 文字を Phrase フィールドおよび SoundsLike フィールドで使用することもできます。

文字 コード 文字 コード
À 00C0 à 00E0
Á 00C1 á 00E1
 00C2 â 00E2
à 00C3 ã 00E3
Ä 00C4 ä 00E4
Ç 00C7 ç 00E7
È 00C8 è 00E8
É 00C9 é 00E9
Ê 00CA ê 00EA
Ë 00CB ë 00EB
Í 00CD í 00ED
Ñ 00D1 ñ 00F1
Ó 00D3 ó 00F3
Ô 00D4 ô 00F4
Õ 00D5 õ 00F5
Ö 00D6 ö 00F6
Ú 00DA ú 00FA
Ü 00DC ü 00FC

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 v 0076
b 0062 w 0077
d 0064 0077 0303
e 0065 z 007A
f 0066 õ 00F5
Amazon EC2 のセキュリティグループ 0067 ĩ 00129
i 0069 ũ 00169
j 006A ɐ̃ 0250 0303
k 006B ɔ 0254
I 006C ɛ 025B
m 006D ɲ 0272
n 006E ɾ 027E
006F ʁ 0281
p 0070 ʃ 0283
s 0073 ʎ 028E
t 0074 ʒ 0292
0074 0283 ʤ 02A4
u 0075 1EBD

ロシア語文字セット

ロシア語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

文字 コード 文字 コード
' 0027 п 043F
- 002D р 0440
. 002E с 0441
а 0430 т 0442
б 0431 у 0443
в 0432 ф 0444
г 0433 х 0445
д 0434 ц 0446
е 0435 ч 0447
ж 0436 ш 0448
з 0437 щ 0449
и 0438 ъ 044A
й 0439 ы 044B
к 043A ь 044C
л 043B э 044D
м 043C ю 044E
н 043D я 044F
о 043E ё 0451

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
b 0062 t 0074
0062 02B2 0074 0283
d 0064 0074 02B2
0064 02B2 u 0075
f 0066 v 0076
0066 02B2 0076 02B2
Amazon EC2 のセキュリティグループ 0067 x 0078
067 02B2 0078 02B2
i 0069 z 007A
j 006A 007A 02B2
k 006B æ 00E6
006B 02B2 ə 0259
I 006C ɛ 025B
006C 02B2 ɨ 0268
m 006D ʃ 0283
006D 02B2 ʃʲ 0283 02B2
n 006E ʊ 028A
006E 02B2 ʌ 028C
p 0070 ʒ 0292
0070 02B2 ˈi 02C8 0069
r 0072 ˈo 02C8 006F
0072 02B2 ˈv 02C8 0075
s 0073 ˈɛ 02C8 025B
0073 02B2 ˈɨ 02C8 0268
ts 0074 0073 ˈa 02C8 0061

スペイン語の文字セット

スペインのカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

以下の Unicode 文字を Phrase フィールドおよび SoundsLike フィールドで使用することもできます。

文字 コード 文字 コード
Á 00C1 á 00E1
É 00C9 é 00E9
Í 00CD ë 00ED
Ó 00D3 ó 0XF3
Ú 00DA ú 00FA
Ñ 00D1 ñ 0XF1
ü 00FC    

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 r 0072
b 0062 s 0073
d 0064 t 0074
e 0065 u 0075
f 0066 v 0076
Amazon EC2 のセキュリティグループ 0067 w 0077
h 0068 x 0078
i 0069 z 007A
j 006A ŋ 014B
k 006B ɲ 0272
I 006C ɾ 027E
m 006D ʃ 0283
n 006E ʝ 029D
006F ʧ 02A7
p 0070 θ 03B8

タミル語文字セット

タミル語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

文字 コード 文字 コード
0B85 0BB0
0B86 0BB2
0B87 0BB5
0B88 0BB4
0B89 0BB3
0B8A 0BB1
0B8E 0BA9
0B8F 0B9C
0B90 0BB6
0B92 0BB7
0B93 0BB8
0B94 0BB9
0B83 0BCD
0B95 0BBE
0B99 ி 0BBF
0B9A 0BC0
0B9E 0BC1
0B9F 0BC2
0BA3 0BC6
0BA4 0BC7
0BA8 0BC8
0BAA 0BCA
0BAE 0BCB
0BAF 0BCC

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 v 0076
0061 02D0 w 0077
b 0062 z 007A
d 0064 æ 00E6
0064 0292 ð 00F0
e 0065 ŋ 014B
f 0066 ɑ 0251
Amazon EC2 のセキュリティグループ 0067 ɔ 0254
h 0068 ə 0259
i 0069 ɛ 025B
0069 02D0 ɡ 0261
j 006A ɪ 026A
k 006B ɭ 026D
I 006C ɲ 0272
m 006D ɳ 0273
n 006E ɹ 0279
006E 032A ɹ 0279
006F ɹ̩ 0279 0329
006F 02D0 ɾ 027E
p 0070 ʂ 0282
r 0072 ʃ 0283
s 0073 ʈ 0288
t 0074 ʊ 028A
0074 032A ʋ 028B
0074 0283 ʌ 028C
u 0075 ʒ 0292
0075 02D0 θ 03B8

テルグ語文字セット

テルグ語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

文字 コード 文字 コード
- 002D 0C24
0C01 0C25
0C02 0C26
0C03 0C27
0C05 0C28
0C06 0C2A
0C07 0C2B
0C08 0C2C
0C09 0C2D
0C0A 0C2E
0C0B 0C2F
0C0C 0C30
0C0E 0C31
0C0F 0C32
0C10 0C33
0C12 0C35
0C13 0C36
0C14 0C37
0C15 0C38
0C16 0C39
0C17 0C3E
0C18 ి 0C3F
0C19 0C40
0C1A 0C41
0C1B 0C42
0C1C 0C43
0C1D 0C44
0C1E 0C47
0C1F 0C48
0C20 0C4A
0C21 0C4B
0C22 0C4C
0C23 0C4D

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
0064 032A ð 00F0
d̪̤ 0064 032A 0324 ŋ 014B
0064 0292 ɑ 0251
dʒ̤ 0064 0292 0324 ɔ 0254
e 0065 ɖ 0256
0065 02D0 ɖ̤ 0256 0324
f 0066 ə 0259
h 0068 ɛ 025B
i 0069 ɡ 0261
0069 0290 ɡ̤ 0261 0324
j 006A ɪ 026A
k 006B ɭ 026D
006B 02B0 ɲ 0272
I 006C ɳ 0273
m 006D ɹ 0279
n 006E ɹ̩ 0279 0329
006F ɽ 027D
006F 02D0 ʂ 0282
p 0070 ʃ 0283
0070 02B0 ʈ 0288
r 0072 ʈʰ 0288 02B0
s 0073 ʊ 028A
t 0074 ʋ 028B
0074 032A ʌ 028C
t̪ʰ 0074 032A 02B0 ʒ 0292
t 0074 θ 03B8
tʃʰ 0074 0283 02B0    

トルコ語文字セット

トルコ語のカスタム語彙の場合は、Phrase フィールドおよび SoundsLike フィールドに次の文字を使用できます。

  • a~z

  • A~Z

  • ' (apostrophe)

  • - (ハイフン)

  • . (ピリオド)

以下の Unicode 文字を Phrase フィールドおよび SoundsLike フィールドで使用することもできます。

文字 コード 文字 コード
Ç 00C7 ö 00F6
Ö 00D6 û 00FB
Ü 00DC ü 00FC
â 00E2 Ğ 011E
ä 00E4 ğ 011F
ç 00E7 İ 0130
è 00E8 ı 0131
é 00E9 Ş 015E
ê 00EA ş 015F
í 00ED š 0161
î 00EE ž 017E
ó 00F3    

入力ファイルの IPA フィールドには、国際音声記号 (IPA) 文字を使用できます。

文字 コード 文字 コード
a 0061 u 0075
0061 02D0 0075 02D0
b 0062 v 0076
c 0063 w 0077
d 0064 y 0079
e 0065 0079 02D0
0065 02D0 z 007A
f 0066 ø 00F8
Amazon EC2 のセキュリティグループ 0067 øː 00F8 02D0
h 0068 ŋ 014B
i 0069 ɟ 025F
0069 02D0 ɣ 0263
j 006A ɫ 026B
k 006B ɯ 026F
I 006C ɯː 026F 02D0
m 006D ɾ 027E
n 006E ʃ 0283
006F ʒ 0292
006F 02D0 ʔ 0294
p 0070 ʤ 02A4
s 0073 ʧ 02A7
t 0074