轉錄數字和標點符號 - Amazon Transcribe

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

轉錄數字和標點符號

Amazon Transcribe會自動將標點符號新增至所有支援的語言,並針對在其書寫系統中使用大小寫區分的語言,適當地將文字大寫。

對於大多數語言,數字會轉錄為其單詞形式。但是,如果您的媒體使用英文或德文,Amazon Transcribe則會根據使用數字的上下文而有所不同。

例如,如果發言者說「」Meet me at eight-thirty AM on June first at one-hundred Main Street with three-dollars-and-fifty-cents and one-point-five chocolate bars,則會將其轉錄為:

  • 英語和德語方言:Meet me at 8:30 a.m. on June 1st at 100 Main Street with $3.50 and 1.5 chocolate bars

  • 所有其他語言:Meet me at eight thirty a m on June first at one hundred Main Street with three dollars and fifty cents and one point five chocolate bars

要查看與英語和德語口語數字相關的所有規則,請參閱下表。

規則

英語方言

(輸入音頻 → 輸出文本)

德語方言

(輸入音頻 → 輸出文本)

將大於 10 的基數轉換為數字。

  • "Fifty five" → 55

  • "a hundred" → 100

  • "One thousand and thirty one" → 1031

  • "One hundred twenty-three million four hundred fifty six thousand seven hundred eight nine" → 123,456,789

  • "fünfundfünfzig" → 55

  • "vier tausend sechs hundert einundachtzig" → 4681

  • "eine Sache" → "eine Sache"

當「百萬」或「億」後面沒有數字時,將基數後面接著「百萬」或「億」的數字轉換為數字後接著字詞。

  • "one hundred million" → 100 million

  • "one billion" → 1 billion

  • "two point three million" → 2.3 million

  • "zehn Millionen Menschen" → 10 Millionen Menschen

  • "zehn Millionen fünf hundert tausend" → 10.500.000

將大於 10 的序數轉換為數字。

  • "Forty third" → 43rd

  • "twenty sixth avenue" → 26th avenue

  • "dreiundzwanzigste" → 23

  • "vierzigster" → 40

  • "ich war Erster" → "ich war Erster"

將分數轉換成數字形式。

  • "a quarter" → 1/4

  • "three sixteenths" → 3/16

  • "a half" → 1/2

  • "a hundredth" → 1/100

分數會轉換成數值格式。

  • "ein Drittel" → "ein Drittel"

如果一行中有多個,則將小於 10 的數字轉換為數字。

  • "three four five" → 345

  • "My phone number is four two five five five five one two one two" → My phone number is 4255551212

  • "eins zwei drei" → 123

  • "plus vier neun zwei vier eins" → +49241

單詞「點」或「點」顯示為十進制。

  • "three hundred and three dot five" → 303.5

  • "three point twenty three" → 3.23

  • "zero point four" → 0.4

  • "point three" → 0.3

小數由「,」表示。

  • "zweiundzwanzig komma drei" → 22,3

將數字後的「百分比」轉換成百分比符號 (%)。

  • "twenty three percent" → 23%

  • "twenty three point four five percent" → 23.45%

  • "fünf Prozent Hürde" → 5% Hürde

  • "dreiundzwanzig komma vier Prozent" → 23,4%

將貨幣單詞轉換為符號。

將數字之後的單詞「美元」,「U S 美元」,「澳元」,「AUD」或「USD」轉換為數字之前的美元符號($)。

  • "one dollar and fifteen cents" → $1.15

  • "twenty three USD" → $23

  • "twenty three Australian dollars" → $23

將數字後面的字詞「鎊」、「英鎊」或「GDB」轉換為數字前的英鎊符號(£)。

  • "twenty three pounds" → £23

  • "I have two thousand pounds" → I have £2,000

  • "five pounds thirty three pence" → £5.33

將數字後的字詞「盧比」、「印度盧比」或「INR」轉換為數字前的盧比符號 (₹)。

  • "twenty three rupees" → ₹23

  • "fifty rupees thirty paise" → ₹50.30

將單詞「歐元」轉換為歐元符號。

  • "ein euro" → 1 €

  • "ein Euro vierzig" → 1,40 €

  • "ein Euro vierzig Cent" → 1,40 €

將時間轉換成數字。

  • "seven a m eastern standard time" → 7 a.m. eastern standard time

  • "twelve thirty p m" → 12:30 p.m.

  • "vierzehn Uhr fünfzehn" → 14:15 Uhr

轉換日期成為數字。

  • "May fifth twenty twelve" → May 5th 2012

  • "May five twenty twelve" → May 5 2012

  • "five May twenty twelve" → 5 May 2012

  • "dritter Dezember neunzehn hundert sechundfünfzig" → 3. Dezember 1956

用單詞「to」分隔數字的跨度。

  • "twenty three to thirty seven" → 23 to 37

不適用

年份表示為四位數;這僅在 20、21 世紀和 22 世紀的年份內有效。

  • "nineteen sixty two" → 1962

  • the year is twenty twelve「→ 今年是2012

  • "twenty nineteen" → 2019

  • "twenty one thirty" → 2130

不適用

顯示斜線和破折號。

  • "fifty-five dash thirteen" → 55-13

顯示斜線。

  • "fifty-five slash thirteen" → 55 slash 13

  • "fünfundfünfzig Schrägstrich dreizehn" → 55/13

  • "fünfundfünfzig Strich dreizehn" → 55-13

顯示編號段落。

編號段落會使用段落符號 (§) 顯示。

  • "paragraph seventeen" → paragraph 17

  • "Paragraf siebzehn" → § 17