긴 오디오 파일 생성 - Amazon Polly

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

긴 오디오 파일 생성

대량 텍스트 구절의 TTS 파일을 생성하려면 Amazon Polly의 비동기식 합성 기능을 사용합니다. 이 기능에서는 다음 세 가지 SpeechSynthesisTask API를 사용합니다.

  • StartSpeechSynthesisTask: 새 합성 작업을 시작합니다.

  • GetSpeechSynthesisTask: 이전에 제출된 합성 작업에 대한 세부 정보를 반환합니다.

  • ListSpeechSynthesisTasks: 제출된 합성 작업을 모두 나열합니다.

SynthesizeSpeech 작업은 대부분의 경우 지연 시간이 상대적으로 짧은 실시간에 가깝게 오디오를 생성합니다. 이를 위해서 이 작업에서는 3000자만 합성할 수 있습니다.

Amazon Polly의 비동기식 합성 기능을 사용하면 문서를 합성하고 반환하는 방식을 변경함으로써 더 큰 텍스트 문서를 처리하는 어려움을 해결할 수 있습니다. StartSpeechSynthesisTask를 사용하여 입력 텍스트를 제출하고 합성 요청을 하면 Amazon Polly는 요청을 대기열에 넣은 다음 시스템 리소스를 사용할 수 있게 되면 바로 백그라운드에서 요청을 비동기적으로 처리합니다. 그러 다음 Amazon Polly는 결과 스피치 또는 스피치 마크 스트림(필수)을 Amazon Simple Storage Service(Amazon S3) 버킷에 직접 업로드하고(선택) SNS 주제를 통해 완성된 파일의 가용성에 대해 알려줍니다.

이러한 방식으로 실시간에 가까운 처리를 제외한 모든 기능을 최대 100,000개의 요금이 청구되는 문자(또는 총 200,000자) 길이의 텍스트에 사용할 수 있습니다.

이 방법을 사용하여 문서를 합성하려면 오디오 파일을 저장할 수 있는 쓰기 가능한 Amazon S3 버킷이 있어야 합니다. 옵션 SNS 주제 식별자를 제공하여 합성화된 오디오 준비가 완료될 때 알림을 받을 수 있습니다. 합성 작업이 완료되면 Amazon Polly에서 해당 주제에 대한 메시지를 게시합니다. 이 메시지에는 합성 작업이 실패한 경우 유용한 오류 정보가 포함될 수도 있습니다. 이렇게 하려면 합성 작업을 생성하는 사용자도 SNS 주제에 게시할 수 있어야 합니다. SNS 주제를 생성하고 구독하는 방법에 대한 자세한 내용은 Amazon SNS 문서를 참조하세요.

암호화(Encryption)

원하는 경우 출력 파일을 S3 버킷에 암호화된 형식으로 저장할 수 있습니다. 이렇게 하려면 제공되는 가장 강력한 블록 암호 중 하나인 256비트 Advanced Encryption Standard(AES-256)를 사용하여 Amazon S3 버킷 암호화를 활성화합니다.