에서 긴 오디오 파일 만들기 AWS CLI - Amazon Polly

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

에서 긴 오디오 파일 만들기 AWS CLI

Amazon Polly 비동기식 합성 기능은 다음 세 가지 SpeechSynthesisTask API를 사용하여 대량의 텍스트 작업을 수행합니다.

  • StartSpeechSynthesisTask: 새 합성 작업을 시작합니다.

  • GetSpeechSynthesisTask: 이전에 제출된 합성 작업에 대한 세부 정보를 반환합니다.

  • ListSpeechSynthesisTasks: 제출된 합성 작업을 모두 나열합니다.

대량의 텍스트 합성(StartSpeechSynthesisTask)

실시간 SynthesizeSpeech를 사용하여 생성할 수 있는 파일보다 큰 오디오 파일을 생성하려는 경우 StartSpeechSynthesisTask 작업을 사용합니다. StartSpeechSynthesisTask에는 SynthesizeSpeech 작업에 필요한 인수 이외에 Amazon S3 버킷 이름도 필요합니다. 작업에 대한 상태 알림을 받으려는 경우 다른 두 개의 옵션 인수인 출력 파일에 대한 키 접두사와 SNS 주제에 대한 ARN도 사용 가능합니다.

  • OutputS3BucketName: 합성을 업로드해야 하는 Amazon S3 버킷의 이름입니다. 이 버킷은 Amazon Polly 서비스와 동일한 리전에 있어야 합니다. 또한 호출하는 데 사용되는 IAM 사용자는 해당 버킷에 액세스할 수 있어야 합니다. [필수]

  • OutputS3KeyPrefix: 출력 파일의 키 접두사입니다. 버킷의 사용자 지정 디렉터리 종류의 키에 출력 스피치 파일을 저장하려는 경우 이 파라미터를 사용합니다. [선택]

  • SnsTopicArn: 작업 상태에 대한 알림을 받으려면 경우 사용할 SNS 주제 ARN입니다. 이 SNS 주제는 Amazon Polly 서비스와 동일한 리전에 있어야 합니다. 또한 호출하는 데 사용되는 IAM 사용자는 해당 주제에 액세스할 수 있어야 합니다. [선택]

예를 들어, 다음 예제를 사용하여 미국 동부 (오하이오) 지역에서 start-speech-synthesis-task AWS CLI 명령을 실행할 수 있습니다.

다음 AWS CLI 예제는 유닉스, 리눅스, macOS용으로 포맷되었습니다. Windows의 경우 각 줄 끝에 있는 백슬래시(\) Unix 연속 문자를 캐럿(^)으로 바꿉니다. 입력 텍스트는 큰 따옴표(")로 감싸고 내부 태그에는 작은 따옴표(')를 사용합니다.

aws polly start-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https://polly.us-east-2.amazonaws.com/" \ --output-format mp3 \ --output-s3-bucket-name your-bucket-name \ --output-s3-key-prefix optional/prefix/path/file \ --voice-id Joanna \ --text file://text_file.txt

이렇게 하면 다음과 비슷한 모양의 응답이 생성됩니다.

"SynthesisTask": { "OutputFormat": "mp3", "OutputUri": "https://s3.us-east-2.amazonaws.com/your-bucket-name/optional/prefix/path/file.<task_id>.mp3", "TextType": "text", "CreationTime": [..], "RequestCharacters": [..], "TaskStatus": "scheduled", "TaskId": [task_id], "VoiceId": "Joanna" }

start-speech-synthesis-task 작업은 다음과 같은 여러 새 필드를 반환합니다.

  • OutputUri: 출력 스피치 파일의 위치입니다.

  • TaskId: Amazon Polly에서 생성한 스피치 합성 작업의 고유 식별자입니다.

  • CreationTime: 작업이 처음 제출된 시점의 타임스탬프입니다.

  • RequestCharacters: 작업에서 요금이 청구되는 문자 수입니다.

  • TaskStatus: 제출된 작업의 상태에 대한 정보를 제공합니다.

    작업이 제출될 때 초기 상태에서 scheduled를 표시합니다. Amazon Polly에서 작업 처리를 시작하면 상태가 inProgress로 변경되고 나중에 completed 또는 failed로 변경됩니다. 작업이 실패하면 or 작업을 호출할 때 오류 메시지가 반환됩니다. GetSpeechSynthesisTask ListSpeechSynthesisTasks

작업이 완료되면 OutputUri에서 지정된 위치에서 스피치 파일을 사용할 수 있습니다.

스피치 합성 작업에 대한 정보 검색

GetSpeechSynthesisTask 작업을 사용하여 오류, 상태 등의 작업 정보를 가져올 수 있습니다. 이를 위해서는 task-id에 의해 반환된 StartSpeechSynthesisTask가 필요합니다.

예를 들어, 다음 예제를 사용하여 get-speech-synthesis-task AWS CLI 명령을 실행할 수 있습니다.

aws polly get-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/" \ --task-id task identifier

또한 ListSpeechSynthesisTasks 작업을 사용하여 현재 리전에서 실행한 스피치 합성 작업을 모두 나열할 수 있습니다.

예를 들어, 다음 예제를 사용하여 list-speech-synthesis-tasks AWS CLI 명령을 실행할 수 있습니다.

aws polly list-speech-synthesis-tasks \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/"