기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
음성 속도
음성 간의 자연적인 차이로 인해 사용 가능한 각 음성은 텍스트를 약간씩 다른 속도로 말합니다. 예를 들어, 미국 영어 음성에서 "Mary had a little lamb"을 말할 때 Ivy와 Joanna는 Matthew보다 조금 더 빠르며, Joey보다 상당히 빠릅니다.
음성 간에 많은 차이가 있고 그 차이의 정도는 말하는 텍스트에 따라 다를 수 있기 때문에, Amazon Polly 음성에서 표준 속도(분당 단어 수)는 사용할 수 없습니다. 하지만 를 사용하여 SpeechMarks 선택한 텍스트를 음성으로 말하는 데 걸리는 시간을 확인할 수 있습니다. Amazon Polly에서 스피치 마크 사용에 대한 자세한 내용은 스피치 마크 사용 을(를) 참조하세요.
텍스트 구절을 말하는 데 걸리는 대략적인 시간을 보려면
를 엽니다 AWS CLI.
필요에 따라 채워 넣고 다음 코드를 실행합니다.
aws polly synthesize-speech \ --language-code
optional language code if needed
--output-format json \ --voice-id[name of desired voice]
\ --text '[desired text]
' \ --speech-mark-types='["viseme"]' \ LengthOfText.txtLengthOfText.txt를 엽니다.
텍스트가 "Mary had a little lamb"이었던 경우, Amazon Polly가 반환하는 마지막 몇 줄은 다음과 같습니다.
{"time":882,"type":"viseme","value":"t"}
{"time":964,"type":"viseme","value":"a"}
{"time":1082,"type":"viseme","value":"p"}
마지막 viseme인, 본질적으로 "lamb"의 마지막 문자의 소리는 스피치가 시작된 후 1,082밀리초에 시작됩니다. 이는 결코 오디오 길이는 아니지만 그에 근접하며, 음성 간 비교의 기준이 될 수 있습니다.
음성 속도 변경
특정 애플리케이션에서 좋아하는 음성의 속도를 낮추거나 높이고자 할 수 있습니다. 음성 속도를 고려해야 할 경우를 위해 Amazon Polly는 SSML 태그를 사용하여 이를 수정하는 기능을 제공합니다.
예:
여러분의 조직이 이민자 청중에게 책을 읽어 주는 애플리케이션을 만들려고 합니다. 이 청중은 영어를 말하지만, 능숙도는 제한적입니다. 이 경우 애플리케이션이 말하는 동안 스피치 속도를 낮춰 청중이 이해할 수 있도록 조금 더 많은 시간을 제공하는 방법을 고려할 수 있습니다.
Amazon Polly에서 다음과 같이 SSML <prosody> 태그를 사용하여 스피치 속도를 낮출 수 있습니다.
<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
또는
<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
Amazon Polly에서 SSML을 사용할 때 두 가지 속도 옵션을 사용할 수 있습니다.
속도 사전 설정:
x-slow
,slow
,medium
,fast
,x-fast
. 이러한 경우 각 옵션의 속도는 근사값으로, 선호하는 음성에 따라 다릅니다.medium
옵션은 일반 음성 속도입니다.스피치 속도의 n%: 스피치 속도의 백분율로, 20%~200%를 사용할 수 있습니다. 이러한 경우 원하는 정확한 속도를 선택할 수 있습니다. 그러나 실제 음성 속도는 근사값으로, 선택한 음성에 따라 다릅니다. 100%는 음성의 일반 속도입니다.
각 옵션의 속도는 근사값이며 선택하는 음성에 따라 다를 수 있으므로, 선택한 음성을 다양한 속도로 테스트하여 사용자의 요구에 정확히 맞는 속도를 확인하는 것이 좋습니다.
prosody
태그를 사용하여 최상의 효과를 내는 방법에 대한 자세한 내용은 볼륨, 말하기 속도 및 피치 제어 을(를) 참조하세요.