Amazon Polly의 할당량 - Amazon Polly

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Polly의 할당량

Amazon Polly는 과도한 요청을 거부하는 방식으로 고객 트래픽에 할당량을 적용합니다. 표준 음성이 포함된 SynthesizeSpeech 요청의 기본 할당량은 단일 리전 단일 AWS 계정에서 초당 80건의 트랜잭션(tps) 입니다. 제한이 증가하지 않은 상태에서 표준 음성을 사용하여 초당 100개의 SynthesizeSpeech 요청을 생성한 경우 Amazon Polly에서 초당 80개의 요청이 성공하고 초당 20개의 요청이 제한됩니다. 이러한 요청은 HTTP 상태 400과 ThrottlingException을(를) 나타내는 응답 헤더를 반환합니다. Amazon Polly는 또한 요청 속도를 기준으로 모든 작업에 대한 트래픽을 조절합니다.

스피치 합성 제한 예제

  • 영어 알파벳의 처음 24자를 한 번에 한 글자씩 합성합니다. 각 문자의 합성이 50밀리초 미만이고 작업 제한이 8tps인 경우 24개의 문자를 합성하는 데 최소 3초가 걸립니다. 이 시간 동안에는 초당 최대 8개의 문자를 합성할 수 있습니다. 그러나 추가 요청은 제한됩니다. 요청은 짧은 시간 동안 지속되므로 중복되지 않고 순차적으로 합성됩니다.

  • 16단락 텍스트를 합성합니다. 각 단락이 합성되고 클라이언트 측에서 2초 이내에 완전히 수신되는 상황에서 작업이 8개로 제한되어 있는 경우 16개 단락을 모두 합성하는 데 최소 4초가 걸립니다. 처음 1초 동안에는 요청을 8개까지 시작할 수 있습니다. 동시 요청 중에는 동시성 제한으로 인해 새 합성을 시작하려는 모든 시도가 제한됩니다. 처음 요청이 처리되는 첫 2초 후 나머지 8개 단락을 합성할 수 있습니다.

Amazon Polly를 사용할 때는 다음 제한 사항을 염두에 두어야 합니다.

지원되는 리전

Amazon Polly를 사용할 수 있는 AWS 리전 목록은 Amazon Web Services 일반 참조Amazon Polly 엔드포인트 및 할당량을 참조하세요. 신경 음성을 지원하는 리전은 신경 TTS용 기능 및 리전 호환성을 참조하세요. 미국 동부(버지니아 북부)에서 롱폼 음성을 사용할 수 있습니다.

할당량 및 제한 속도

다음 표에는 Amazon Polly 작업당 제한 속도가 정의되어 있습니다. AWS Management Console을(를) 사용하여 필요한 경우 조정 가능한 할당량에 대한 할당량 증가를 요청할 수 있습니다.

Operation

제한

어휘

DeleteLexicon

PutLexicon

GetLexicon

ListLexicons

이 작업이 완료된 후 2건의 초당 트랜잭션(tps)입니다.

허용되는 최대 버스트는 4tps입니다.

스피치

DescribeVoices

80tps 및 버스트 한도 100tps

SynthesizeSpeech

표준 음성: 80tps 및 버스트 한도 100tps

신경 음성: 8tps 및 버스트 한도 10tps

롱폼 음성: 8tps 및 버스트 한도 10tps

StartSpeechSynthesisTask

표준 음성: 10tps 및 버스트 한도 12tps

신경 음성: 1tps

롱폼 음성: 1tps

GetSynthesizeSpeechTaskListSynthesizeSpeechTask

최대 10tps 결합 허용

동시 요청

Amazon Polly는 동시 요청에 대한 제한도 지원합니다. 표준 음성의 경우 Amazon Polly는 최대 80개의 동시 요청에 대해 80tps를 지원합니다. 신경 음성의 경우 Amazon Polly는 최대 18개의 동시 요청에 대해 8tps의 버스트 한도와 10tps의 버스트 제한을 지원합니다. 롱폼 음성의 경우 Amazon Polly는 최대 26개의 동시 요청을 지원합니다.

제한 완화를 위한 모범 사례

  • 백오프 및 지터로 제한을 재시도하여 부하를 단기간에 분산하고 가용성에 영향을 주지 않으면서 예상치 못한 사용량 피크를 처리할 수 있습니다. 많은 프로그래밍 언어에서 기본적으로 AWS 코드 샘플 카탈로그이(가) 이 작업을 수행하도록 구성되어 있습니다. 자세한 내용은 기능 재시도 동작을 참조하세요.

  • Amazon Polly 지표를 사용하세요. Amazon Polly는 자동으로 CloudWatch에 게시하여 현재 사용량을 분석하고 사용량 증가를 예측합니다.

참고

할당량 증가(해당하는 경우)를 요청하기 전에 이 페이지의 가이드라인에 따라 tps 요구 사항을 계산합니다. Amazon Polly는 비용 절감을 위해 고객의 요구에 따라 필요한 연산 리소스만 확보합니다.

발음 어휘

  • 계정당 어휘를 최대 100개까지 저장할 수 있습니다.

  • 어휘 이름은 최대 20자의 영숫자 문자열로 지정할 수 있습니다.

  • 각 어휘의 최대 크기는 40,000자입니다. 어휘의 크기는 SynthesizeSpeech 작업의 지연 시간에 영향을 줍니다.

  • 어휘의 <phoneme> 또는 <alias> 대체어마다 100자까지 지정할 수 있습니다.

어휘를 사용하는 방법에 대한 자세한 내용은 어휘 관리을(를) 참조하세요.

SynthesizeSpeech API 작업

SynthesizeSpeech의 사용량을 추정할 때는 Amazon Polly에서 생성된 오디오, 특히 대화형 애플리케이션의 오디오가 재생되는 데 보통 몇 초 이상 걸린다는 점을 염두에 두어야 합니다. 이렇게 하면 동시 사용자 수가 많아도 SynthesizeSpeech 요청 속도가 줄어듭니다. 또한 Amazon Polly는 합성한 동시 SynthesizeSpeech 요청 수를 기준으로 요청을 조절합니다. 동시 요청에 대한 별도의 설정은 없습니다. 동시 요청 한도는 허용되는 tps 수와 항상 같은 값을 가지며 이에 따라 조정됩니다.

간단한 예제 애플리케이션. Amazon Polly를 사용하여 일련의 단편 소설을 재생하는 애플리케이션을 구축할 수 있습니다. 이런 종류의 앱을 사용하면 첫 번째 스토리가 재생되기 시작하고 사용자가 애플리케이션을 종료할 때까지 다음 스토리가 계속 재생됩니다. 각 스토리를 합성하는 데 약 0.5초, 재생하는 데 약 10초가 소요됩니다. 이 시나리오에서는 고객이 애플리케이션을 사용하는 동안 10초마다 한 건의 SynthesizeSpeech 호출이 발생할 것으로 예상할 수 있습니다. 이는 애플리케이션을 동시에 사용하는 고객 10명이 초당 호출 1건을 발생시킨다는 것으로 환산됩니다. 1,000명의 고객이 동시에 애플리케이션을 사용하는 경우 초당 평균 트랜잭션 속도인 100건에서 SynthesizeSpeech에 불과할 것으로 예상할 수 있습니다.

SynthesizeSpeech API 작업 사용과 관련하여 다음 제한 사항에 유의해야 합니다.

  • 청구되는 입력 텍스트의 최대 크기는 3,000자(총 6,000자)입니다. SSML 태그는 청구 문자 수로 계산되지 않습니다.

  • 입력 텍스트에 적용할 최대 5개의 어휘를 지정할 수 있습니다.

  • 출력 오디오 스트림(합성)은 10분으로 제한되며, 이 시간을 초과할 경우 나머지 스피치는 잘립니다.

자세한 내용은 SynthesizeSpeech을(를) 참조하세요.

참고

SynthesizeSpeech API 작업의 몇 가지 제한을 StartSythensizeSpeechTask API 작업을 사용하여 우회할 수 있습니다. 자세한 내용은 긴 오디오 파일 생성을(를) 참조하세요.

SpeechSynthesisTask API 작업

StartSpeechSynthesisTask, GetSpeechSynthesisTaskListSpeechSynthesisTasks API 작업 사용과 관련하여 다음 제한 사항에 유의해야 합니다.

  • 청구되는 입력 텍스트의 최대 크기는 100,000자(총 200,000자)입니다. SSML 태그는 청구 문자 수로 계산되지 않습니다.

  • 입력 텍스트에 적용할 최대 5개의 어휘를 지정할 수 있습니다.

SSML(Speech Synthesis Markup Language)

SSML 사용과 관련하여 다음 제한 사항에 유의해야 합니다.

  • <audio>, <lexicon>, <lookup><voice> 태그는 지원되지 않습니다.

  • <break> 요소는 각각 10초의 최대 기간을 지정할 수 있습니다.

  • <prosody> 태그는 -80% 미만의 비율 속성 값을 지원하지 않습니다.

자세한 내용은 SSML 문서에서 스피치 생성을(를) 참조하세요.