대체 트랜스크립션

가 오디오를 트랜스크립션하면 동일한 Amazon Transcribe 트랜스크립트의 다른 버전을 생성하고 각 버전에 신뢰도 점수를 할당합니다. 일반적인 트랜스크립션에서는 신뢰도 점수가 가장 높은 버전만 받아볼 수 있습니다.

대체 트랜스크립션을 켜면는 신뢰도가 낮은 다른 버전의 트랜스크립트를 Amazon Transcribe 반환합니다. 최대 10개의 대체 트랜스크립션을 반환하도록 선택할 수 있습니다. 가 Amazon Transcribe 식별하는 것보다 더 많은 수의 대안을 지정하면 실제 대안 수만 반환됩니다.

모든 대체는 동일한 트랜스크립션 출력 파일에 있으며 세그먼트 수준에서 표시됩니다. 세그먼트는 화자 변경 또는 오디오의 일시 중지처럼, 말하기 도중 자연스럽게 쉬는 지점입니다.

대체 트랜스크립션은 배치 트랜스크립션에만 사용할 수 있습니다.

트랜스크립션 출력의 구조는 다음과 같습니다. 코드 예시의 줄임표(...)는 간결성을 위해 콘텐츠가 제거된 위치를 나타냅니다.

지정된 세그먼트에 대한 완전한 최종 트랜스크립션.


"results": {
    "language_code": "en-US",
    "transcripts": [
        {
            "transcript": "The amazon is the largest rainforest on the planet."
        }
    ],

이전 transcript 섹션의 각 단어에 대한 신뢰도 점수.


"items": [
    {
        "start_time": "1.15",
        "end_time": "1.35",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "The"
            }
        ],
        "type": "pronunciation"
    },
    {
        "start_time": "1.35",
        "end_time": "2.05",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "amazon"
            }
        ],
        "type": "pronunciation"
    },

대체 트랜스크립트는 트랜스크립션 출력의 segments 부분에 있습니다. 각 세그먼트에 대한 대체는 신뢰도 점수를 내림차순으로 정렬됩니다.


"segments": [
            {
                "start_time": "1.04",
                "end_time": "5.065",
                "alternatives": [
                    {    
                ...
                        "transcript": "The amazon is the largest rain forest on the planet.",
                        "items": [
                            {
                             "start_time": "1.15",
                                "confidence": "1.0",
                                "end_time": "1.35",
                                "type": "pronunciation",
                                "content": "The"
                            },
                            ...
                            {
                                "start_time": "3.06",
                                "confidence": "0.0037",
                                "end_time": "3.38",
                                "type": "pronunciation",
                                "content": "rain"
                            },
                            {
                                "start_time": "3.38",
                                "confidence": "0.0037",
                                "end_time": "3.96",
                                "type": "pronunciation",
                                "content": "forest"
                            },

트랜스크립션 출력 종료 시 상태.
```
"status": "COMPLETED"
}
```

대체 트랜스크립션 요청

AWS Management Console, AWS CLI 또는 AWS SDK를 사용하여 대체 트랜스크립션을 요청할 수 있습니다. 예를 보려면 다음을 참조하세요.

AWS Management Console에 로그인합니다.
탐색 창에서 트랜스크립션 작업을 선택한 다음 작업 생성(오른쪽 상단)을 선택합니다. 그러면 작업 세부 정보 지정 페이지가 열립니다.
작업 세부 정보 지정 페이지에 포함하려는 필드를 모두 채운 후 다음을 선택합니다. 그러면 작업 구성 - 선택 사항 페이지로 이동합니다.

대체 결과를 선택하고 트랜스크립트에 포함할 대체 트랜스크립션 결과의 최대 수를 지정합니다.
작업 생성을 선택하여 트랜스크립션 작업을 실행합니다.

이 예시에서는 start-transcription-job 명령 및 ShowAlternatives 파라미터를 사용합니다. 자세한 내용은 StartTranscriptionJob 및 ShowAlternatives 단원을 참조하세요.

단, 요청에 ShowAlternatives=true을 포함하는 경우 MaxAlternatives 역시 포함해야 합니다.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings ShowAlternatives=true,MaxAlternatives=4

다음은 start-transcription-job 명령을 사용하는 또 다른 예 및 대체 트랜스크립션을 포함하는 요청 본문입니다.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-alt-transcription-job.json

my-first-alt-transcription-job.json 파일에는 다음과 같은 요청 본문이 포함되어 있습니다.


{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "ShowAlternatives": true,
        "MaxAlternatives": 4
   }
}

다음 예제에서는 AWS SDK for Python (Boto3) 를 사용하여 start_transcription_job 메서드에 대한 ShowAlternatives 인수를 사용하여 대체 트랜스크립션을 요청합니다. 자세한 내용은 StartTranscriptionJob 및 ShowAlternatives 단원을 참조하세요.

기능별, 시나리오 및 교차 서비스 예제 AWS SDKs를 사용하는 추가 예제는 AWS SDKs를 사용한 Amazon Transcribe의 코드 예제장을 참조하세요.

단, 요청에 'ShowAlternatives':True을 포함하는 경우 MaxAlternatives 역시 포함해야 합니다.


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'ShowAlternatives':True, 
        'MaxAlternatives':4
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

스트리밍 언어 식별

트랜스크립션 정확도 향상