스피치 마크 형식

스피치 마크는 SynthesizeSpeech 또는 StartSpeechSynthesisTask 명령을 위한 SpeechMarkTypes 옵션을 사용하여 요청합니다. 입력 텍스트에서 반환할 메타데이터 요소를 지정합니다. 최대 네 가지 형식의 메타데이터를 요청할 수 있지만, 요청당 반드시 하나 이상을 지정해야 합니다. 요청 시 오디오 출력이 생성되지 않습니다.

예를 들어 AWS CLI에서


--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly는 다음 요소를 사용하여 스피치 마크를 생성합니다.

sentence – 입력 텍스트의 문장 요소를 나타냅니다.
word – 텍스트의 단어 요소를 나타냅니다.
viseme – 말하는 각 음소에 대응하는 얼굴과 입의 움직임을 설명합니다. 자세한 내용은 Viseme과 Amazon Polly을(를) 참조하세요.
ssml – SSML 입력 텍스트의 <mark> 요소를 설명합니다. 자세한 내용은 SSML 문서에서 스피치 생성을(를) 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

스피치 마크

Viseme과 Amazon Polly