Aktivierung der Lautsprecherpartitionierung in Batch-Transkriptionen

Sie können die Lautsprecherpartitionierung in einem Batch-Transkriptionsjob entweder über die StartMedicalTranscriptionJobAPI oder die aktivierenAWS Management Console. Auf diese Weise können Sie den Text in einer Konversation zwischen Arzt und Patient pro Sprecher aufteilen und festlegen, wer in der Transkriptionsausgabe was gesagt hat.

Um in Ihrem Transkriptionsjob die Diarisierung von SprechernAWS Management Console zu aktivieren, aktivieren Sie die Audioidentifikation und anschließend die Lautsprecherpartitionierung.

Melden Sie sich an der AWS Management Console an.
Wählen Sie im Navigationsbereich unterAmazon Transcribe Medical die Option Transcription Jobs.
Wählen Sie Create job (Auftrag erstellen) aus.
Geben Sie auf der Seite „Stellendetails angeben“ Informationen zu Ihrem Transkriptionsjob ein.
Wählen Sie Next (Weiter).
Aktivieren Sie die Audioidentifikation.
Wählen Sie als Audioidentifizierungstyp die Option Lautsprecherpartitionierung aus.
Geben Sie für Maximale Anzahl von Lautsprechern die maximale Anzahl von Lautsprechern in Ihrer Audiodatei ein, von denen Sie glauben, dass sie sprechen.
Wählen Sie Create (Erstellen) aus.

So aktivieren Sie die Lautsprecherpartitionierung mithilfe eines Batch-Transkriptionsjobs (API)

Geben Sie für die StartMedicalTranscriptionJobAPI Folgendes an.
1. Geben Sie fürMedicalTranscriptionJobName einen Namen an, der in Ihrem einzigartig istAWS-Konto.
2. Geben Sie fürLanguageCode den Sprachcode an, der der in der Audiodatei gesprochenen Sprache entspricht.
3. Geben Sie für denMediaFileUri Parameter desMedia Objekts den Namen der Audiodatei an, die Sie transkribieren möchten.
4. FürSpecialty geben Sie in der Audiodatei das medizinische Fachgebiet des behandelnden Arztes an.
5. Legen Sie für Type die Option CONVERSATION fest.
6. Geben Sie für denAmazon S3 Bucket anOutputBucketName, in dem die Transkriptionsergebnisse gespeichert werden sollen.
7. Geben Sie für dasSettings Objekt Folgendes an.
  1. ShowSpeakerLabels – true.
  2. MaxSpeakerLabels— Eine Ganzzahl zwischen 2 und 10, um die Anzahl der Lautsprecher anzugeben, von denen Sie glauben, dass sie in Ihrem Audio sprechen.

Die folgende Anforderung verwendet die,AWS SDK for Python (Boto3) um einen Batch-Transkriptionsjob eines Patientendialogs mit einem Arzt in der Grundversorgung zu starten, wobei die Lautsprecherpartitionierung aktiviert ist.



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
    MedicalTranscriptionJobName = job_name,
    Media={
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'DOC-EXAMPLE-BUCKET',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US',
    Specialty = 'PRIMARYCARE',
    Type = 'CONVERSATION',
    OutputBucketName = 'DOC-EXAMPLE-BUCKET',
Settings = {'ShowSpeakerLabels': True,
         'MaxSpeakerLabels': 2
         }
         )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Der folgende Beispielcode zeigt die Transkriptionsergebnisse eines Transkriptionsjobs bei aktivierter Lautsprecherpartitionierung.



{
    "jobName": "job ID",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Professional answer."
            }
        ],
        "speaker_labels": {
            "speakers": 1,
            "segments": [
                {
                    "start_time": "0.000000",
                    "speaker_label": "spk_0",
                    "end_time": "1.430",
                    "items": [
                        {
                            "start_time": "0.100",
                            "speaker_label": "spk_0",
                            "end_time": "0.690"
                        },
                        {
                            "start_time": "0.690",
                            "speaker_label": "spk_0",
                            "end_time": "1.210"
                        }
                    ]
                }
            ]
        },
        "items": [
            {
                "start_time": "0.100",
                "end_time": "0.690",
                "alternatives": [
                    {
                        "confidence": "0.8162",
                        "content": "Professional"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "0.690",
                "end_time": "1.210",
                "alternatives": [
                    {
                        "confidence": "0.9939",
                        "content": "answer"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "alternatives": [
                    {
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ]
    },
    "status": "COMPLETED"
}

Um eine Audiodatei eines Gesprächs zwischen einem in der Grundversorgung tätigen Arzt und einem Patienten zu transkribieren (AWS CLI)

Führen Sie folgenden Code aus.



                    
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://example-start-command.json

Der folgende Code zeigt den Inhalt vonexample-start-command.json.


{
    "MedicalTranscriptionJobName": "my-first-med-transcription-job",       
     "Media": {
          "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac"
      },
      "OutputBucketName": "DOC-EXAMPLE-BUCKET",
      "OutputKey": "my-output-files/", 
      "LanguageCode": "en-US",
      "Specialty": "PRIMARYCARE",
      "Type": "CONVERSATION",
      "Settings":{
          "ShowSpeakerLabels": true,
          "MaxSpeakerLabels": 2
        }
}

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Aktivieren der Lautsprecherpartitionierung

Partitionierung von Lautsprechern in Echtzeit-Streams