스피치 마크 형식 - Amazon Polly

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

스피치 마크 형식

스피치 마크는 SynthesizeSpeech 또는 StartSpeechSynthesisTask 명령을 위한 SpeechMarkTypes 옵션을 사용하여 요청합니다. 입력 텍스트에서 반환할 메타데이터 요소를 지정합니다. 최대 네 가지 형식의 메타데이터를 요청할 수 있지만, 요청당 반드시 하나 이상을 지정해야 합니다. 요청 시 오디오 출력이 생성되지 않습니다.

예를 들어 AWS CLI에서

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly는 다음 요소를 사용하여 스피치 마크를 생성합니다.

  • sentence – 입력 텍스트의 문장 요소를 나타냅니다.

  • word – 텍스트의 단어 요소를 나타냅니다.

  • viseme – 말하는 각 음소에 대응하는 얼굴과 입의 움직임을 설명합니다. 자세한 내용은 Viseme과 Amazon Polly을(를) 참조하세요.

  • ssml – SSML 입력 텍스트의 <mark> 요소를 설명합니다. 자세한 내용은 SSML 문서에서 스피치 생성을(를) 참조하세요.