バッチ文字起こしでの話者分割の有効化 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

バッチ文字起こしでの話者分割の有効化

バッチ文字起こしジョブで話者パーティション化の有効有効を有効に有効するには、API またはを使用します。パーティション化の有効有効有効を有効に有効できます。有効化有効を有効にするには、StartMedicalTranscriptionJobAPI またはを使用しますAWS Management Console。これにより、臨床医と患者の会話でテキストをパーティション化し、文字起こし出力で誰が何を言ったかを判断できます。

AWS Management Console文字起こしジョブで話者ダイアライゼーションを有効にするには、オーディオ識別を有効にしてから話者パーティション化の有効有効を有効にします有効にします有効にします有効にします有効にします有効にします有効にします有効にします。

  1. AWS Management Consoleにサインインします。

  2. ナビゲーションペインのAmazon Transcribe Medical で、[文字起こしジョブ] を選択します。

  3. [Create job (ジョブの作成)] を選択します。

  4. [ジョブの詳細を指定する] ページで、文字起こしジョブに関する情報を入力します。

  5. [Next] (次へ) を選択します。

  6. [オーディオ識別] を有効にします。

  7. オーディオ識別タイプには、「スピーカーパーティショニング」を選択します。

  8. 話者の最大数 では、オーディオで話していると思われる話者の最大数を指定します。

  9. [作成] を選択します。

バッチ文字起こしジョブ (API) を使用して話者のパーティション化の有効有効有効有効有効有効を有効に有効にする有効有効有効を有効にするには有効
  • StartMedicalTranscriptionJob API では、以下のものを指定します。

    1. MedicalTranscriptionJobName の場合、AWS アカウント で一意の名前を指定します。

    2. LanguageCode の場合、音声ファイル内で話されている言語に対応する言語コードです。

    3. MediaFileUri オブジェクトの Media パラメータの場合、文字起こしを行うメディアファイルの名前を指定します。

    4. Specialty の場合、音声ファイルで話す臨床医の専門分野を指定します。

    5. Type には、CONVERSATION を指定します。

    6. にはOutputBucketName、Amazon S3文字起こし結果を保存するバケットを指定します。

    7. Settings オブジェクトとして、以下を指定します。

      1. ShowSpeakerLabelstrue.

      2. MaxSpeakerLabels - オーディオ内で話していると思われるスピーカーの数を示す 2 ~ 10 の整数です。

次のリクエストでは、AWS SDK for Python (Boto3)を使用して、話者パーティション化の有効化された有効化を有効にしたプライマリケアの臨床医の患者との対話のバッチ文字起こしジョブを開始します。

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media={ 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'DOC-EXAMPLE-BUCKET', Settings = {'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

次の例のコードは、スピーカーパーティション化の有効化の有効有効化されたパーティション化の有効有効を示しています。パーティション化の有効有効有効を有効にします有効化されたパーティション化の有効有効を示しています。パーティション化の有効有効を有効にします有効

{ "jobName": "job ID", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Professional answer." } ], "speaker_labels": { "speakers": 1, "segments": [ { "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [ { "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" } ] } ] }, "items": [ { "start_time": "0.100", "end_time": "0.690", "alternatives": [ { "confidence": "0.8162", "content": "Professional" } ], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [ { "confidence": "0.9939", "content": "answer" } ], "type": "pronunciation" }, { "alternatives": [ { "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }
プライマリケアを実践している臨床医と患者との間の会話の音声ファイルの文字起こし (AWS CLI)
  • 以下のコードを実行します。

    aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    以下のコードは、example-start-command.json の内容を示しています。

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }