ストリーミング文字起こしによる言語識別 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ストリーミング文字起こしによる言語識別

ストリーミング言語識別により、メディアストリーミングで話されている主要な言語を識別できます。 Amazon Transcribe言語識別には最低 3 秒の音声が必要です。

ストリーミング言語識別を使用する言語コードを 2 つ以上指定する必要があり、ストリームごとに選択できる言語識別できる言語識別ル 1 つの言語コードを指定する必要があり、ストリームごとに選択できる言語識別ル 1 つの言語コードを指定する必要があり、ストリームごとに選択できる言語識別ル 1 つの言語コードを指定する必要があり つまり、en-USen-AU を同じ文字起こしの言語オプションとして選択することはできません。

また、指定した言語コードの一覧から優先言語を選択するオプションもあります。優先言語を追加すると、言語識別処理が速くなるため、短いオーディオクリップに役立ちます。

重要

入力した言語コードのいずれも、オーディオで識別された言語と一致しない場合、Amazon Transcribe指定された言語コードから最も近い言語を選択します。次に、その言語でトランスクリプトを作成します。例えば、メディアが米国英語 (en-US) で、言語コードを提供した場合zh-CNfr-FR、メディアをドイツ語 (de-DE)Amazon TranscribeAmazon Transcribe 合わせでドイツ語の文字起こしを製作する可能性が高いです。de-DE言語コードと話し言葉が一致しないと、文字起こしが不正確になる可能性があるため、言語コードを含める際には注意が必要です。

メディアに 2 つのチャンネルがある場合は、Amazon Transcribe各チャンネルで話されている主要な言語を識別できます。この場合は、ChannelIdentification パラメータを true に設定することで各チャンネルが別々に文字起こしされます。このパラメータのデフォルトはであることに注意してくださいfalse。それを変えなければ、最初のチャンネルだけが文字起こしされます。

ストリーミング言語識別をカスタム言語モデルやリダクションと組み合わせることはできません。言語識別を他の言語と組み合わせる場合、ストリーミング文字起こしの言語識別でサポートされる言語に制限されます。「サポートされる言語」を参照してください。

注記

PCM と FLAC は、ストリーミング言語識別でサポートされる唯一のオーディオ形式です。

ストリーミングメディアでの言語識別を使用する

ストリーミングトランスクリプションでは、HTTP/2 AWS Management Console、またはを使用して自動言語識別を使用できますWebSockets。例については、以下を参照してください。

  1. AWS Management Consoleにサインインします。

  2. ナビゲーションペインで、[リアルタイム文字起こし] を選択します。言語設定 にスクロールして、最小化されている場合はこのフィールドを展開します。

    
                    Amazon Transcribeコンソールのスクリーンショット:「リアルタイム文字起こし」ページの折りたたまれた「言語設定」タブ
  3. 言語の自動識別 を選択します。

    
                    Amazon Transcribeコンソールのスクリーンショット:「言語設定」タブの拡張
  4. 文字起こしの言語コードを 2 つ以上指定してください。言語ごとに 1 つの言語識別しか提供できないことに注意してください。例えば、en-USen-AU を同じ文字起こしの言語オプションとして選択することはできません。

    
                    Amazon Transcribeコンソールのスクリーンショット:言語コード選択ドロップダウンメニュー
  5. (オプション)前の手順で選択した言語のサブセットから、文字起こしの優先言語を選択できます。

    
                    Amazon Transcribeコンソールのスクリーンショット:優先言語オプションが表示された「言語設定」パネル
  6. これで、ストリームを書き起こす準備ができました。[ストリーミングを開始] を選択し、話し始めます。ディクテーションを終了するには、「ストリーミングを停止」を選択します。

この例では、言語識別を有効にした状態で HTTP/2 リクエストを作成します。で HTTP/2 ストリーミングを使用する際の詳細についてはAmazon Transcribe、を参照してくださいHTTP/2 ストリームの設定。に固有のパラメータとヘッダーの詳細についてはAmazon Transcribe、を参照してくださいStartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-language: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

identify-languageリクエストに使用する場合は、必ず含める必要がありますlanguage-optionslanguage-codeidentify-language同じリクエストでとの両方を使用することはできません。

パラメータの定義は API リファレンスにあります。すべてのAWS API オペレーションに共通するパラメータは、「共通パラメータ」セクションに記載されています。

この例では、 WebSocket ストリームで言語識別を使用する署名付き URL を作成します。読みやすくするために、改行が追加されています。 WebSocket でのストリームの使用方法の詳細についてはAmazon Transcribe、を参照してくださいのセットアップ WebSocket ストリーム。パラメータの詳細については、「StartStreamTranscription」を参照してください。

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-language=true &language-options=en-US,de-DE &preferred-language=en-US

identify-languageリクエストに使用する場合は、必ず含める必要がありますlanguage-optionslanguage-codeidentify-language同じリクエストでとの両方を使用することはできません。

パラメータの定義は API リファレンスにあります。すべてのAWS API オペレーションに共通するパラメータは、「共通パラメータ」セクションに記載されています。