스트리밍 트랜스크립션을 통한 언어 식별 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

스트리밍 트랜스크립션을 통한 언어 식별

스트리밍 언어 식별을 통해 미디어 스트림에서 사용되는 지배적 언어를 식별할 수 있습니다. Amazon Transcribe는 언어를 식별하기 위해 3초 이상의 음성을 필요로 합니다.

스트림에 한 가지 언어만 포함된 경우 단일 언어 식별을 활성화하여 미디어 파일에서 사용되는 지배적 언어를 식별하고 이 언어만 사용하여 트랜스크립트를 생성할 수 있습니다.

스트림에 두 개 이상의 언어가 포함된 경우 다국어 식별을 활성화하여 스트림에서 사용되는 모든 언어를 식별하고 식별된 각 언어를 사용하여 트랜스크립트를 생성할 수 있습니다. 다국어 트랜스크립트가 생성된다는 점에 유의하세요. 트랜스크립트를 번역하는 데 Amazon Transcribe과 같은 다른 서비스를 사용할 수 있습니다.

스트리밍 언어 식별을 사용하려면 언어 코드를 두 개 이상 제공해야 하며 스트림당 언어당 언어 방언을 하나만 선택할 수 있습니다. 즉, 동일한 트랜스크립션에 대해 en-USen-AU를 언어 옵션으로 선택할 수 없습니다.

또한 제공하는 언어 코드 세트에서 기본 언어를 선택할 수도 있습니다. 기본 언어를 추가하면 언어 식별 프로세스의 속도를 높일 수 있으므로 짧은 오디오 클립에 유용합니다.

중요

제공한 언어 코드 중 어떤 것도 오디오에서 식별된 언어와 일치하지 않는 경우 Amazon Transcribe는 지정된 언어 코드 중 가장 가깝게 일치하는 언어를 선택합니다. 그런 다음 해당 언어로 트랜스크립트를 생성합니다. 예를 들어 미디어가 미국 영어(en-US)로 되어 있고 Amazon Transcribe에 언어 코드 zh-CN, fr-FRde-DE를 제공하면 Amazon Transcribe는 미디어를 독일어(de-DE)와 일치시켜 독일어 트랜스크립션을 작성할 수 있습니다. 언어 코드와 음성 언어가 일치하지 않으면 트랜스크립트가 정확하지 않을 수 있으므로 언어 코드를 포함할 때는 주의를 기울이는 것이 좋습니다.

미디어에 채널이 두 개 있는 경우 Amazon Transcribe는 각 채널에서 사용되는 지배적 언어를 식별할 수 있습니다. 이 경우 ChannelIdentification 파라미터를 true로 설정하면 각 채널이 개별적으로 트랜스크립션됩니다. 이 파라미터의 기본값은 false입니다. 변경하지 않으면 첫 번째 채널만 트랜스크립션되고 하나의 언어만 식별됩니다.

스트리밍 언어 식별은 사용자 지정 언어 모델 또는 편집과 결합할 수 없습니다. 언어 식별을 다른 기능과 결합하는 경우 해당 기능과 스트리밍 트랜스크립션에서 지원되는 언어로 제한됩니다. 지원되는 언어를 참조하세요.

참고

스트리밍 언어 식별에 지원되는 오디오 형식은 PCM 및 FLAC뿐입니다.

다국어 오디오의 언어 식별

다국어 식별은 다국어 스트림을 위한 것으로 스트림에서 사용되는 지원되는 언어 모두를 반영하는 트랜스크립트를 제공합니다. 즉, 화자가 대화 도중에 언어를 바꾸거나 각 참가자가 서로 다른 언어를 사용하는 경우 트랜스크립션 출력은 각 언어를 올바르게 감지하고 트랜스크립션합니다.

예를 들어 스트림에 미국 영어(en-US)와 힌디어(hi-IN)를 번갈아 사용하는 이중 언어 화자가 포함되어 있는 경우 다국어 식별을 통해 미국 영어는 en-US로 힌디어는 hi-IN으로 식별하고 트랜스크립션할 수 있습니다. 이는 한 가지 지배적 언어만 사용하여 트랜스크립트를 작성하는 단일 언어 식별과는 다릅니다. 이 경우 지배적 언어가 아닌 음성 언어는 부정확하게 트랜스크립션됩니다.

참고

현재 다국어 식별에서는 교정 및 사용자 지정 언어 모델이 지원되지 않습니다.

스트리밍 미디어를 통한 언어 식별 사용

AWS Management Console, HTTP/2 또는 WebSockets를 사용하여 스트리밍 트랜스크립션에서 자동 언어 식별을 사용할 수 있습니다. 예를 보려면 다음을 참조하세요.

  1. AWS Management Console에 로그인합니다.

  2. 탐색 창에서 실시간 트랜스크립션을 선택합니다. 언어 설정까지 아래로 스크롤하고 최소화된 경우 이 필드를 확장합니다.

    Amazon Transcribe 콘솔 스크린샷: '실시간 트랜스크립션' 페이지의 축소된 '언어 설정' 탭.
  3. 자동 언어 식별 또는 자동 다국어 식별을 선택합니다.

    Amazon Transcribe 콘솔 스크린샷: 확장된 '언어 설정' 탭.
  4. 트랜스크립션에 사용할 언어 코드를 최소 두 개 제공합니다. 언어당 방언을 하나만 제공할 수 있다는 점에 유의하세요. 예를 들어 동일한 트랜스크립션에 대해 en-USfr-CA 모두를 언어 옵션으로 선택할 수 없습니다.

    Amazon Transcribe 콘솔 스크린샷: 언어 코드 선택 드롭다운 메뉴.
  5. (선택 사항) 이전 단계에서 선택한 언어 하위 집합 중에서 트랜스크립트에 사용할 기본 언어를 선택할 수 있습니다.

    Amazon Transcribe 콘솔 스크린샷: 기본 언어 옵션이 있는 '언어 설정' 패널.
  6. 이제 스트림을 트랜스크립션할 준비가 되었습니다. 스트리밍 시작을 선택하고 말하기 시작합니다. 구술을 끝내려면 스트리밍 중지를 선택합니다.

이 예시에서는 언어 식별이 활성화된 HTTP/2 요청을 생성합니다. Amazon Transcribe로 HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 HTTP/2 스트림 설정을 참조하세요. Amazon Transcribe 관련 파라미터 및 헤더에 대한 자세한 내용은 StartStreamTranscription을 참조하세요.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-language: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

이 예시에서는 다국어 식별이 활성화된 HTTP/2 요청을 생성합니다. Amazon Transcribe로 HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 HTTP/2 스트림 설정을 참조하세요. Amazon Transcribe 관련 파라미터 및 헤더에 대한 자세한 내용은 StartStreamTranscription을 참조하세요.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-multiple-languages: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

요청에 identify-language 또는 identify-multiple-languages를 사용하는 경우 language-options 역시 포함해야 합니다. 동일한 요청에서 language-codeidentify-language 둘 다 사용할 수는 없습니다.

파라미터 정의는 API 참조에서 찾을 수 있으며, 모든 AWS API 작업에 공통적인 파라미터는 공통 파라미터 섹션에 나열되어 있습니다.

이 예시에서는 WebSocket 스트림에서 언어 식별을 사용하는 미리 서명된 URL을 만듭니다. 가독성을 높이기 위해 줄바꿈이 추가되었습니다. Amazon Transcribe로 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 WebSocket 스트림 설정을 참조하세요. 파라미터에 대한 자세한 내용은 StartStreamTranscription을 참조하세요.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-language=true &language-options=en-US,de-DE &preferred-language=en-US

이 예시에서는 WebSocket 스트림에서 다국어 식별을 사용하는 미리 서명된 URL을 만듭니다. 가독성을 높이기 위해 줄바꿈이 추가되었습니다. Amazon Transcribe로 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 WebSocket 스트림 설정을 참조하세요. 파라미터에 대한 자세한 내용은 StartStreamTranscription을 참조하세요.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-multiple-languages=true &language-options=en-US,de-DE &preferred-language=en-US

요청에 identify-language 또는 identify-multiple-languages를 사용하는 경우 language-options 역시 포함해야 합니다. 동일한 요청에서 language-codeidentify-language 둘 다 사용할 수는 없습니다.

파라미터 정의는 API 참조에서 찾을 수 있으며, 모든 AWS API 작업에 공통적인 파라미터는 공통 파라미터 섹션에 나열되어 있습니다.