긴 오디오 파일

대량 텍스트 구절의 TTS 파일을 생성하려면 Amazon Polly의 비동기식 합성 기능을 사용합니다. 이 기능에서는 다음 세 가지 SpeechSynthesisTask API를 사용합니다.

StartSpeechSynthesisTask: 새 합성 작업을 시작합니다.
GetSpeechSynthesisTask: 이전에 제출된 합성 작업에 대한 세부 정보를 반환합니다.
ListSpeechSynthesisTasks: 제출된 합성 작업을 모두 나열합니다.

SynthesizeSpeech 작업은 대부분의 경우 지연 시간이 상대적으로 짧은 실시간에 가깝게 오디오를 생성합니다. 이를 위해서 이 작업에서는 3000자만 합성할 수 있습니다.

Amazon Polly의 비동기식 합성 기능을 사용하면 문서를 합성하고 반환하는 방식을 변경함으로써 더 큰 텍스트 문서를 처리하는 어려움을 해결할 수 있습니다. StartSpeechSynthesisTask를 사용하여 입력 텍스트를 제출하고 합성 요청을 하면 Amazon Polly는 요청을 대기열에 넣은 다음 시스템 리소스를 사용할 수 있게 되면 바로 백그라운드에서 요청을 비동기적으로 처리합니다. 그러 다음 Amazon Polly는 결과 스피치 또는 스피치 마크 스트림(필수)을 Amazon Simple Storage Service(Amazon S3) 버킷에 직접 업로드하고(선택) SNS 주제를 통해 완성된 파일의 가용성에 대해 알려줍니다.

이러한 방식으로 실시간에 가까운 처리를 제외한 모든 기능을 최대 100,000개의 요금이 청구되는 문자(또는 총 200,000자) 길이의 텍스트에 사용할 수 있습니다.

이 방법을 사용하여 문서를 합성하려면 오디오 파일을 저장할 수 있는 쓰기 가능한 Amazon S3 버킷이 있어야 합니다. 옵션 SNS 주제 식별자를 제공하여 합성화된 오디오 준비가 완료될 때 알림을 받을 수 있습니다. 합성 작업이 완료되면 Amazon Polly에서 해당 주제에 대한 메시지를 게시합니다. 이 메시지에는 합성 작업이 실패한 경우 유용한 오류 정보가 포함될 수도 있습니다. 이렇게 하려면 합성 작업을 생성하는 사용자도 SNS 주제에 게시할 수 있어야 합니다. SNS 주제를 생성하고 구독하는 방법에 대한 자세한 내용은 Amazon SNS 문서를 참조하세요.

암호화(Encryption)

원하는 경우 출력 파일을 S3 버킷에 암호화된 형식으로 저장할 수 있습니다. 이렇게 하려면 제공되는 가장 강력한 블록 암호 중 하나인 256비트 Advanced Encryption Standard(AES-256)를 사용하여 Amazon S3 버킷 암호화를 활성화합니다.

주제

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

어휘 삭제

비동기식 합성에 대한 IAM 정책 설정