Verwendung der Kanalidentifizierung in einer Batch-Transkription Verwenden der Kanalidentifizierung in einer Streaming-Transkription

Transkribieren von Mehrkanal-Audio

Wenn Ihr Audio über zwei Kanäle verfügt, können Sie die Kanalidentifikation verwenden, um die Sprache von jedem Kanal separat zu transkribieren. Amazon Transcribe unterstützt derzeit kein Audio mit mehr als zwei Kanälen.

In Ihrem Transkript sind die Kanäle mit den Bezeichnungen ch_0 und ch_1 versehen.

Zusätzlich zu den standardmäßigen Transkriptionsabschnitten (transcripts und items) enthalten Anfragen mit aktivierter Kanalidentifizierung einen Abschnitt channel_labels. Dieser Abschnitt enthält jede Äußerung oder jedes Satzzeichen, gruppiert nach Kanal, sowie die zugehörigen Kanalbezeichnungen, Zeitstempel und Konfidenzwert.


"channel_labels": {
    "channels": [
        {
            "channel_label": "ch_0",
            "items": [                                      
                {
                    "channel_label": "ch_0",
                    "start_time": "4.86",
                    "end_time": "5.01",
                    "alternatives": [
                        {
                            "confidence": "1.0",
                            "content": "I've"
                        }
                    ],
                    "type": "pronunciation"
                },
                ...               
            "channel_label": "ch_1",
            "items": [
                {
                    "channel_label": "ch_1",
                    "start_time": "8.5",
                    "end_time": "8.89",
                    "alternatives": [
                        {
                            "confidence": "1.0",
                            "content": "Sorry"
                        }
                    ],
                    "type": "pronunciation"
                },
                ...
            "number_of_channels": 2
        },

Wenn eine Person auf einem Kanal zur gleichen Zeit wie eine Person auf einem anderen Kanal spricht, überschneiden sich die Zeitstempel für jeden Kanal, während die Personen übereinander sprechen.

Ein vollständiges Beispieltranskript mit Kanalidentifikation finden Sie unter Beispiel Kanalidentifikationsausgabe (Batch).

Verwendung der Kanalidentifizierung in einer Batch-Transkription

Um Kanäle in einer Batch-Transkription zu identifizieren, können Sie das AWS Management ConsoleAWS CLIAWS SDKs, oder verwenden. Im Folgenden finden Sie Beispiele:

Melden Sie sich an der AWS Management Console an.
Wählen Sie im Navigationsbereich Transkriptionsaufträge und dann Auftrag erstellen (oben rechts). Dies öffnet die Seite Auftragsdetails angeben.
Füllen Sie alle Felder aus, die Sie auf der Seite Auftragsdetails angeben möchten, und wählen Sie dann Weiter. Dadurch gelangen Sie zur Seite Auftrag konfigurieren – optional.

Wählen Sie im Bereich Audioeinstellungen die Option Kanalidentifikation (unter der Überschrift „Art der Audioidentifikation“).
Wählen Sie Auftrag erstellen, um Ihren Transkriptionsauftrag auszuführen.

In diesem Beispiel verwenden wir den start-transcription-job. Weitere Informationen finden Sie unter StartTranscriptionJob.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings ChannelIdentification=true

Hier ist ein weiteres Beispiel mit dem start-transcription-jobBefehl und einem Anforderungstext, der die Kanalidentifikation für diesen Job ermöglicht.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-transcription-job.json

Die Datei my-first-transcription-job.json enthält den folgenden Anfragetext.


{
    "TranscriptionJobName": "my-first-transcription-job",
    "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
    "OutputBucketName": "amzn-s3-demo-bucket",
    "OutputKey": "my-output-files/", 
    "LanguageCode": "en-US",
    "Settings": {
        "ChannelIdentification": true
    }
}

In diesem Beispiel werden Kanäle mithilfe der AWS SDK für Python (Boto3) Methode start_transcription_job identifiziert. Weitere Informationen finden Sie unter StartTranscriptionJob.


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'ChannelIdentification':True
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Verwenden der Kanalidentifizierung in einer Streaming-Transkription

Um Kanäle in einer Streaming-Transkription zu identifizieren, können Sie HTTP/2 oder verwenden WebSockets. Beispiele finden Sie im Folgenden:

In diesem Beispiel wird eine HTTP/2-Anfrage erstellt, die Kanäle in Ihrer Transkriptionsausgabe trennt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mit Amazon Transcribe finden Sie unter. Einrichten eines HTTP/2-Streams Weitere Einzelheiten zu Parametern und Kopfzeilen, die speziell für Amazon Transcribe gelten, finden Sie unter StartStreamTranscription.


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-channel-identification: TRUE
transfer-encoding: chunked

Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allen AWS API-Operationen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.

In diesem Beispiel wird eine vorzeichenbehaftete URL erstellt, die Kanäle in Ihrer Transkriptionsausgabe trennt. Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Hinweise zur Verwendung von WebSocket Streams mit Amazon Transcribe finden Sie unterEinen WebSocket Stream einrichten. Weitere Einzelheiten zu den Parametern finden Sie unter StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&specialty=PRIMARYCARE
&type=DICTATION
&media-encoding=flac
&sample-rate=16000    
&channel-identification=TRUE

Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allen AWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Beispielausgabe