Amazon Polly의 작동 방식

Amazon Polly는 입력 텍스트를 실제 같은 스피치로 변환합니다. Amazon Polly 음성을 사용하려면 음성 엔진을 선택하고 음성 합성 메서드를 직접적으로 호출한 다음 합성하려는 텍스트를 입력하고 오디오 출력 형식을 지정합니다. 그러면 Amazon Polly는 제공된 텍스트를 고품질 스피치 오디오 스트림으로 합성합니다.

입력 텍스트 – 합성하려는 텍스트를 제공하면 Amazon Polly에서 오디오 스트림을 반환합니다. 입력은 일반 텍스트 또는 SSML(Speech Synthesis Markup Language) 형식으로 제공할 수 있습니다. SSML을 사용하면 발음, 볼륨, 음조 및 스피치 속도 등 음성의 다양한 측면을 제어할 수 있습니다. 자세한 내용은 SSML 문서에서 스피치 생성을(를) 참조하세요.
사용 가능한 음성 – Amazon Polly에서는 언어 포트폴리오와 이중 언어 음성(영어 및 힌디어)을 비롯한 다양한 음성을 제공합니다. 대부분의 언어는 남성과 여성이 둘 다 지원되는 여러 음성 중에서 선택할 수 있습니다. 스피치 합성 작업을 시작할 때 음성 ID를 지정하면 Amazon Polly에서 이 음성을 사용하여 텍스트를 스피치로 변환합니다. Amazon Polly는 번역 서비스가 아닙니다. 즉, 합성된 스피치는 텍스트와 동일한 언어를 사용합니다. 텍스트가 아닌 숫자로 표시된 숫자(예: 오십 삼이 아닌 53)가 음성의 언어로 합성됩니다. 자세한 내용은 Amazon Polly의 음성을 참조하세요.
출력 형식 – Amazon Polly는 여러 가지 형식으로 합성된 스피치를 전달할 수 있습니다. 사용자의 요구 사항에 맞는 음성 형식을 선택할 수 있습니다. 예를 들어 웹 및 모바일 애플리케이션에서 사용할 수 있게 MP3 또는 Ogg Vorbis 형식의 스피치를 요청하거나, 또는 AWS IoT 디바이스 및 텔레포니 솔루션에서 사용할 PCM 출력 형식을 요청할 수 있습니다.

참고

브라우저에서 Amazon Polly 예제 음성을 들으려면 Amazon Polly 제품 개요를 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

Amazon Polly란?

이점