转录数字和标点符号 - Amazon Transcribe

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

转录数字和标点符号

Amazon Transcribe自动为所有支持的语言添加标点符号,对于在书写系统中使用区分大小写的语言,相应地将单词大写。

对于大多数语言来说,数字都被转录成单词形式。但是,如果您的媒体使用英语或德语,则会根据使用数字的上下文对数字进行不同的Amazon Transcribe处理。

例如,如果说话者说 “”Meet me at eight-thirty AM on June first at one-hundred Main Street with three-dollars-and-fifty-cents and one-point-five chocolate bars,则将其转录为:

  • 英语和德语方言:Meet me at 8:30 a.m. on June 1st at 100 Main Street with $3.50 and 1.5 chocolate bars

  • 所有其他语言:Meet me at eight thirty a m on June first at one hundred Main Street with three dollars and fifty cents and one point five chocolate bars

要查看与英语和德语中的数字口语相关的所有规则,请参阅下表。

规则

英语方言

(输入音频 → 输出文本)

德语方言

(输入音频 → 输出文本)

将大于十的基数转换为数字。

  • "Fifty five" → 55

  • "a hundred" → 100

  • "One thousand and thirty one" → 1031

  • "One hundred twenty-three million four hundred fifty six thousand seven hundred eight nine" → 123,456,789

  • "fünfundfünfzig" → 55

  • "vier tausend sechs hundert einundachtzig" → 4681

  • "eine Sache" → "eine Sache"

当“million”或“billion”后面没有数字时,将后跟“million”或“billion”的基数词转换为数字后跟一个单词。

  • "one hundred million" → 100 million

  • "one billion" → 1 billion

  • "two point three million" → 2.3 million

  • "zehn Millionen Menschen" → 10 Millionen Menschen

  • "zehn Millionen fünf hundert tausend" → 10.500.000

将大于十的序数转换为数字。

  • "Forty third" → 43rd

  • "twenty sixth avenue" → 26th avenue

  • "dreiundzwanzigste" → 23

  • "vierzigster" → 40

  • "ich war Erster" → "ich war Erster"

将小数转换成数字格式。

  • "a quarter" → 1/4

  • "three sixteenths" → 3/16

  • "a half" → 1/2

  • "a hundredth" → 1/100

分数不会转换为数字格式。

  • "ein Drittel" → "ein Drittel"

如果连续有多个数字,则将小于十的数字转换为数字。

  • "three four five" → 345

  • "My phone number is four two five five five five one two one two" → My phone number is 4255551212

  • "eins zwei drei" → 123

  • "plus vier neun zwei vier eins" → +49241

单词 “点” 或 “点” 显示为十进制。

  • "three hundred and three dot five" → 303.5

  • "three point twenty three" → 3.23

  • "zero point four" → 0.4

  • "point three" → 0.3

小数由 “,” 表示。

  • "zweiundzwanzig komma drei" → 22,3

将单词“percent”转换成数字加百分比符号 (%)。

  • "twenty three percent" → 23%

  • "twenty three point four five percent" → 23.45%

  • "fünf Prozent Hürde" → 5% Hürde

  • "dreiundzwanzig komma vier Prozent" → 23,4%

将货币词语转换为符号。

将数字后面的 “美元”、“美元”、“澳元”、“澳元” 或 “美元” 等词转换为数字前面的美元符号 ($)。

  • "one dollar and fifteen cents" → $1.15

  • "twenty three USD" → $23

  • "twenty three Australian dollars" → $23

将数字后面的单词“pounds”、“British pounds”或“GDB“转换为英镑符号 (£) 加在数字之前。

  • "twenty three pounds" → £23

  • "I have two thousand pounds" → I have £2,000

  • "five pounds thirty three pence" → £5.33

将数字后面的单词“rupees”、“Indian rupees”或“INR”转换卢比符号 (₹) 加在数字之前。

  • "twenty three rupees" → ₹23

  • "fifty rupees thirty paise" → ₹50.30

将 “欧元” 一词转换为欧元符号。

  • "ein euro" → 1 €

  • "ein Euro vierzig" → 1,40 €

  • "ein Euro vierzig Cent" → 1,40 €

将时间转换成数字。

  • "seven a m eastern standard time" → 7 a.m. eastern standard time

  • "twelve thirty p m" → 12:30 p.m.

  • "vierzehn Uhr fünfzehn" → 14:15 Uhr

将日期转换成数字。

  • "May fifth twenty twelve" → May 5th 2012

  • "May five twenty twelve" → May 5 2012

  • "five May twenty twelve" → 5 May 2012

  • "dritter Dezember neunzehn hundert sechundfünfzig" → 3. Dezember 1956

用 “到” 一词分隔数字的跨度。

  • "twenty three to thirty seven" → 23 to 37

不适用

年份以四位数表示;这仅对 20、21 和 22 世纪的年份有效。

  • "nineteen sixty two" → 1962

  • the year is twenty twelve” → 年份是2012

  • "twenty nineteen" → 2019

  • "twenty one thirty" → 2130

不适用

显示斜线和短划线。

  • "fifty-five dash thirteen" → 55-13

显示斜杠。

  • "fifty-five slash thirteen" → 55 slash 13

  • "fünfundfünfzig Schrägstrich dreizehn" → 55/13

  • "fünfundfünfzig Strich dreizehn" → 55-13

显示带编号的段落。

使用段落符号 (§) 显示已编号的段落。

  • "paragraph seventeen" → paragraph 17

  • "Paragraf siebzehn" → § 17