데이터 입력 및 출력 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 입력 및 출력

Amazon Transcribe오디오 데이터를Amazon S3 버킷 또는 미디어 스트림의 미디어 파일로 가져와서 텍스트 데이터로 변환합니다.

Amazon S3버킷에 저장된 미디어 파일을 트랜스크립션하는 경우 일괄 트랜스크립션을 수행하는 것입니다. 미디어 스트림을 트랜스크립션하는 경우 스트리밍 트랜스크립션을 수행하는 것입니다. 이 두 프로세스에는 서로 다른 규칙과 요구 사항이 있습니다.

일괄 트랜스크립션을 사용하면 모든 트랜스크립션 작업을 동시에 처리할 필요가 없는Job 대기열 경우 사용할 수 있습니다. 이렇게 하면Amazon Transcribe 트랜스크립션 작업을 추적하고 슬롯이 있을 때 처리할 수 있습니다.

참고

Amazon Transcribe분석 모델의 품질을 지속적으로 개선하기 위해 콘텐츠를 임시로 저장할 수 있습니다. 자세한 정보는 Amazon Transcribe FAQ를 참조하십시오. 에 의해Amazon Transcribe 저장되었을 수 있는 콘텐츠의 삭제를 요청하려면 로 케이스를 AWS Support여십시오.

미디어 형식

지원되는 미디어 유형은 일괄 트랜스크립션과 스트리밍 트랜스크립션 간에 다르지만 무손실 형식이 모두 권장됩니다. 세부 정보는 다음 표를 참조하세요.

Batch

스트리밍

지원되는 형식

  • AMR

  • FLAC

  • M4A

  • MP3

  • MP4

  • 오그

  • WebM

  • WAV

  • FLAC

  • 오그 오푸스

  • PCM 인코딩

권장 포맷

  • FLAC

  • PCM 16비트 인코딩을 지원하는 WAV

  • FLAC

  • PCM 서명 16비트 리틀 엔디안 오디오 (WAV는 포함되지 않음)

최상의 결과를 얻으려면 PCM 16비트 인코딩이 포함된 FLAC 또는 WAV와 같은 무손실 형식을 사용하십시오.

참고

일부 언어에서는 스트리밍 트랜스크립션이 지원되지 않습니다. 자세한 내용은 지원되는 언어 표의 '데이터 입력' 열을 참조하십시오.

오디오 채널

Amazon Transcribe단일 채널 및 이중 채널 미디어를 지원합니다. 채널이 2개 이상인 미디어는 현재 지원되지 않습니다.

오디오의 한 채널에 여러 스피커가 포함되어 있고 트랜스크립션 출력에서 각 스피커를 파티셔닝하고 레이블을 지정하려는 경우 스피커 파티셔닝 (일자리화) 을 사용할 수 있습니다.

오디오에 별도의 두 채널의 음성이 포함된 경우 채널 식별을 사용하여 트랜스크립트에서 각 채널을 개별적으로 텍스트로 변환할 수 있습니다.

이 두 옵션 모두 하나의 트랜스크립트 파일을 생성합니다.

참고

스피커 파티셔닝 또는 채널 식별을 활성화하지 않은 경우 트랜스크립트 텍스트는 하나의 연속 섹션으로 제공됩니다.

샘플 속도

일괄 트랜스크립션 작업의 경우 샘플 속도를 제공하도록 선택할 수 있지만 이 매개 변수는 선택 사항입니다. 요청에 이를 포함하는 경우 제공하는 값이 오디오의 실제 샘플 속도와 일치하는지 확인하세요. 오디오와 일치하지 않는 샘플 속도를 제공하면 작업이 실패할 수 있습니다.

스트리밍 트랜스크립션의 경우 요청에 샘플 속도를 포함해야 합니다. 일괄 트랜스크립션 작업과 마찬가지로 제공하는 값이 오디오의 실제 샘플 속도와 일치하는지 확인하세요.

전화 녹음과 같은 저음질 오디오의 샘플 레이트는 일반적으로 8,000Hz를 사용합니다. 하이파이 오디오의 경우 16,000Hz에서 48,000Hz 사이의 값을Amazon Transcribe 지원합니다.

출력

트랜스크립션 출력 형식은 JSON 형식입니다. 성적표의 첫 부분에는 단락 형식의 성적 증명서 자체가 포함되며, 그 뒤에 모든 단어와 문장 부호에 대한 추가 데이터가 포함됩니다. 제공되는 데이터는 요청에 포함된 기능에 따라 달라집니다. 성적표에는 최소한 모든 단어의 시작 시간, 종료 시간 및 신뢰도 점수가 포함됩니다. 다음 섹션은 추가 옵션이나 기능을 포함하지 않은 기본 트랜스크립션 요청의 예제 출력을 보여줍니다.

모든 배치 트랜스크립트는Amazon S3 버킷에 저장됩니다. 스크립트를 자체Amazon S3 버킷에 저장하거나 안전한 기본 버킷을Amazon Transcribe 사용하도록 선택할 수 있습니다. Amazon S3버킷 생성 및 사용에 대해 자세히 알아보려면 버킷 사용을 참조하세요.

소유한Amazon S3 버킷에 트랜스크립트를 저장하려면 트랜스크립션 요청에 버킷의 URI를 지정하세요. 일괄 트랜스크립션 작업을 시작하기 전에 이 버킷에 대한Amazon Transcribe 쓰기 권한을 부여해야 합니다. 자체 버킷을 지정하는 경우 스크립트는 제거할 때까지 해당 버킷에 남아 있습니다.

Amazon S3버킷을 지정하지 않는 경우 보안 서비스 관리 버킷을Amazon Transcribe 사용하고 트랜스크립트를 다운로드하는 데 사용할 수 있는 임시 URI를 제공합니다. 임시 URI는 15분간 유효합니다. 제공된 URI를 사용할 때AccessDenied 오류가 발생하면 트랜스크립트의 새 임시 URI를GetTranscriptionJob 요청하세요.

기본 버킷을 선택하면 작업이 만료될 때 (90일) 트랜스크립트가 삭제됩니다. 이 만료일을 초과하여 성적표를 보관하려면 반드시 다운로드해야 합니다.

스트리밍 트랜스크립트는 스트림에 사용하는 것과 동일한 방법을 통해 반환됩니다.

작은 정보

JSON 출력을 Word 형식의 turn-by-turn 트랜스크립트로 변환하려면 이 GitHub 예제 (Python3용) 를 참조하십시오. 이 스크립트는 일괄화가 활성화된 통화 후 분석 트랜스크립트와 표준 배치 트랜스크립트와 함께 작동합니다.

출력 예

트랜스크립트는 단락 형식으로 완전한 필사본을 제공하며, 그 다음에는 모든 단어와 문장 부호에 대한 데이터를 제공하는 word-for-word 세분화가 이어집니다. 여기에는 시작 시간, 종료 시간, 신뢰도 점수 및 유형 (pronunciation또는punctuation) 이 포함됩니다.

다음 예제는 추가 기능을 포함하지 않은 간단한 일괄 트랜스크립션 작업에서 가져온 것입니다. 트랜스크립션 요청에 각 추가 기능을 적용할 때마다 트랜스크립트 출력 파일에 추가 데이터가 제공됩니다.

기본 배치 트랜스크립트에는 두 가지 주요 섹션이 있습니다.

  1. transcripts: 전체 스크립트를 하나의 텍스트 블록에 포함합니다.

  2. items:transcripts 섹션의 각 단어와 문장 부호에 대한 정보가 들어 있습니다.

트랜스크립션 요청에 포함시키는 각 추가 기능은 트랜스크립트에 추가 정보를 생성합니다.

{ "jobName": "my-first-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Welcome to Amazon Transcribe." } ], "items": [ { "start_time": "0.64", "end_time": "1.09", "alternatives": [ { "confidence": "1.0", "content": "Welcome" } ], "type": "pronunciation" }, { "start_time": "1.09", "end_time": "1.21", "alternatives": [ { "confidence": "1.0", "content": "to" } ], "type": "pronunciation" }, { "start_time": "1.21", "end_time": "1.74", "alternatives": [ { "confidence": "1.0", "content": "Amazon" } ], "type": "pronunciation" }, { "start_time": "1.74", "end_time": "2.56", "alternatives": [ { "confidence": "1.0", "content": "Transcribe" } ], "type": "pronunciation" }, { "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }