Amazon Transcribe이란 무엇입니까? - Amazon Transcribe

문서의 영문과 번역 사이에 충돌이 있는 경우에는 영문 버전을 따릅니다. 번역 버전은 기계 번역을 사용하여 제공합니다.

Amazon Transcribe이란 무엇입니까?

Amazon Transcribe는 고급 머신 러닝 기술을 사용하여 오디오 파일의 음성을 인식하고 텍스트로 변환하여 기록합니다. Amazon Transcribe를 사용하면 오디오를 텍스트로 변환할 수 있고, 오디오 파일의 콘텐츠를 통합하는 애플리케이션을 만들 수 있습니다. 예를 들어 비디오 레코딩의 오디오 트랙을 텍스트로 변환하여 비디오 자막을 생성할 수 있습니다.

Amazon Transcribe를 사용하면 다음 언어를 텍스트로 변환해 기록할 수 있습니다.

  • 걸프 아랍어(ar-AE)

  • 현대 표준 아랍어(ar-SA)

  • 표준 중국어 - 본토(zh-CN)

  • 네덜란드어(nl-NL)

  • 호주 영어(en-AU)

  • 영국 영어(en-GB)

  • 인도 영어(en-IN)

  • 아일랜드 영어(en-IE)

  • 스코틀랜드 영어(en-AB)

  • 미국 영어(en-US)

  • 웨일스 영어(en-WL)

  • 스페인어(es-ES)

  • 미국 스페인어(es-US)

  • 프랑스어(fr-FR)

  • 캐나다 프랑스어(fr-CA)

  • 페르시아어(fa-IR)

  • 독일어(de-DE)

  • 스위스 독일어(de-CH)

  • 히브리어(he-IL)

  • 인도 힌디어(hi-IN)

  • 인도네시아어(id-ID)

  • 이탈리아어(it-IT)

  • 일본어(ja-JP)

  • 한국어(ko-KR)

  • 말레이어(ms-MY)

  • 포르투갈어(pt-PT)

  • 브라질 포르투갈어(pt-BR)

  • 러시아어(ru-RU)

  • 타밀어(ta-IN)

  • 텔루구어(te-IN)

  • 터키어(tr-TR)

다음 언어로 스트리밍 오디오를 번역할 수 있습니다.

언어 지원되는 샘플링 속도 지원 위치
호주 영어(en-AU) 8 kHz API
영국 영어(en-GB) 8 kHz API
미국 영어(en-US) 16개 kHz년 8월 일 kHz 콘솔, API
프랑스어(fr-FR) 8 kHz API
캐나다 프랑스어(fr-CA) 8 kHz API
미국 스페인어(es-US) 16개 kHz년 8월 일 kHz 콘솔, API

Amazon Transcribe를 다른 AWS 서비스와 함께 사용하여 애플리케이션을 만들 수 있습니다. 예를 들어 다음을 수행할 수 있습니다.

  • Amazon Transcribe를 사용하여 음성을 텍스트로 변환하고 기록한 다음, 이 텍스트를 Amazon Translate로 전송하여 다른 언어로 번역하고 Amazon Polly을 통해 번역된 텍스트를 음성으로 변환할 수 있습니다.

  • Amazon Transcribe를 사용하여 고객 서비스 통화 녹음을 분석을 위해 텍스트로 변환하고 기록할 수 있습니다. 레코딩을 변환하고 기록한 후 이 기록을 Amazon Comprehend로 전송하여 키워드, 주제, 정서 등을 식별합니다.

  • Amazon Transcribe를 사용하여 TV와 같은 라이브 브로드캐스트를 텍스트로 변환하여 실시간 자막을 제공할 수 있습니다.

Amazon Transcribe를 사용하려면 오디오 파일을 Amazon S3 버킷에 저장합니다. 트랜스크립션 작업의 출력 역시 S3 버킷에 저장됩니다. Amazon S3 버킷으로 전달한 콘텐츠에는 고객 콘텐츠가 포함될 수 있습니다. 중요 데이터 제거에 관한 자세한 내용은 S3 버킷을 비우려면 어떻게 해야 합니까? 단원 또는 S3 버킷을 삭제하려면 어떻게 해야 합니까? 단원을 참조하십시오.

음성 인식

Amazon Transcribe는 오디오 클립에서 말하는 화자를 식별할 수 있으며, 이 기술을 분할(diarization) 또는 화자 식별(speaker identification)이라고 합니다. 화자 인식을 실행하는 경우 Amazon Transcribe는 오디오 클립의 각 화자를 식별하는 속성을 포함합니다. 화자 식별을 사용하여 다음을 수행할 수 있습니다.

  • 녹음된 고객 지원 통화에서 고객과 지원 담당자 식별

  • 자막용 문자 식별

  • 녹음된 보도 자료나 연설에서 화자와 질문자 식별

Amazon Transcribe가 오디오 클립에서 인식하게 하려는 음성의 수를 지정할 수 있습니다.

개별 오디오 채널 트랜스크립션

각 채널 또는 기록된 사운드의 단일 스트림에 대한 기록을 생성하려면 채널 식별을 사용합니다. 채널 식별을 사용하면 Amazon Transcribe에서는 모든 오디오 채널의 결합된 트랜스크립션 하나와 각 오디오 채널의 트랜스크립션, 이렇게 트랜스크립션을 두 개 이상 반환합니다.

여러 채널의 오디오인 경우 채널 식별 사용 예를 들어 다음과 같은 경우 채널 식별을 사용합니다.

  • 녹음에 한 채널에는 고객 서비스 담당자가 다른 채널에는 고객이 있는 경우

  • 진행자가 한 채널에서 녹음되고 다른 채널에서 게스트가 녹음되는 팟캐스트를 텍스트로 변환해 기록하는 경우

채널 식별에 대한 자세한 정보는 다중 채널 오디오 변환 단원을 참조하십시오.

오디오 스트리밍 트랜스크립션

Amazon Transcribe를 사용하면 오디오 스트리밍을 실시간으로 텍스트로 변환해 기록할 수 있습니다. Amazon Transcribe에 오디오 스트림을 보내면 Amazon Transcribe에서는 오디오의 트랜스크립션을 포함한 JSON 객체 스트림을 반환합니다.

오디오 스트림 처리에 대한 자세한 정보는 스트리밍 트랜스크립션 단원을 참조하십시오.

사용자 지정 어휘

사용자 지정 어휘를 작성하여 Amazon Transcribe가 해당 사용 사례에 맞는 단어를 인식하게 하여 음성을 텍스트로 변환하는 데 있어 정확도를 높일 수 있습니다. 예를 들어 산업별 용어와 구절을 포함하는 사용자 지정 어휘를 작성할 수 있습니다.

사용자 지정 어휘를 사용하여 Amazon Transcribe가 다음을 인식하게 할 수 있습니다.

  • 인식하지 않는 단어

  • 해당 부문의 전문 용어

사용자 지정 어휘 작성에 대한 자세한 정보는 사용자 지정 어휘 단원을 참조하십시오.

Amazon Transcribe를 처음 사용하십니까?

처음 사용하는 경우, 먼저 다음 단원을 순서대로 읽어보십시오.

  1. Amazon Transcribe의 작동 방식 - Amazon Transcribe에 대해 소개합니다.

  2. Amazon Transcribe 시작하기- AWS 계정을 설정하고 Amazon Transcribe를 사용하는 방법을 설명합니다.

  3. API 참조 - Amazon Transcribe 작업에 대한 참조 설명서를 소개합니다.