代替文字起こしの生成 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

代替文字起こしの生成

Amazon TranscribeMedical を使用すると、最も信頼性の高い文字起こしを取得できます。また、より低い信頼性で追加の文字起こしを返すようにAmazon Transcribe Medical を設定することもできます。

代替文字起こしを使用して、変換されたオーディオのさまざまな解釈を確認します。たとえば、ユーザーが書き起こしをレビューできるアプリケーションでは、選択できる代替文字起こしを提示できます。

AWS Management Consoleまたは StartMedicalTranscriptionJobAPI を使用して代替トランスクリプションを生成できます。

AWS Management Consoleを使用して代替文字起こしを生成するには、ジョブを設定する際、代替結果を有効にします。

  1. AWS Management Consoleにサインインします。

  2. ナビゲーションペインのAmazon Transcribe Medical で、[文字起こしジョブ] を選択します。

  3. [Create job (ジョブの作成)] を選択します。

  4. [ジョブの詳細を指定する] ページで、文字起こしジョブに関する情報を入力します。

  5. [Next] (次へ) を選択します。

  6. [代替結果] を有効にする。

  7. [代替の最大数] には、2 から 10 までの整数値を入力して、出力に必要な代替文字起こしの最大数を指定します。

  8. [作成] を選択します。

バッチ文字起こしジョブ (API) を使用してオーディオファイル内のテキストを分割するには
  • StartMedicalTranscriptionJob API では、以下のものを指定します。

    1. MedicalTranscriptionJobName の場合、AWS アカウント で一意の名前を指定します。

    2. LanguageCode として、音声ファイルで話されている言語と語彙フィルターの言語に対応する言語コードを指定します。

    3. MediaFileUriMediaオブジェクトのパラメータに、文字起こしを行うメディアファイルの場所を指定します。

    4. Specialty の場合、音声ファイルで話す臨床医の専門分野を指定します。

    5. Type の場合、医療会話を文字起こしするか、口述を筆記するかを指定します。

    6. にはOutputBucketName、Amazon S3文字起こし結果を保存するバケットを指定します。

    7. Settings オブジェクトとして、以下を指定します。

      1. ShowAlternativestrue.

      2. MaxAlternatives - 2 から 10 までの整数値で、文字起こし出力に必要な代替文字起こしの数を示します。

次のリクエストでは、AWS SDK for Python (Boto3) を使用して、最大 2 つの代替文字起こしを生成する文字起こしジョブを開始します。

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', Settings = { 'ShowAlternatives': True, 'MaxAlternatives': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
プライマリケア臨床医と患者との間の会話の音声ファイルを転記するには、AWS CLI
  • 以下のコードを実行します。

    aws transcribe start-transcription-job \ --cli-input-json file://filepath/example-start-command.json

    以下のコードは、example-start-command.json の内容を示しています。

    { "MedicalTranscriptionJobName": "my-first-transcription-job", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }