カスタムボキャブラリーを使用してリアルタイムストリームを文字起こし - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタムボキャブラリーを使用してリアルタイムストリームを文字起こし

リアルタイムストリームでの文字起こしの精度を向上させるために、HTTP/2 WebSocket またはストリーミングを使用したカスタムボキャブラリーを使用できます。HTTP/2 リクエストを開始する場合、StartMedicalStreamTranscription API を使用します。カスタムボキャブラリーはAWS Management Console、StartMedicalStreamTranscriptionAPI を使用するか、 WebSocket プロトコルを使用してリアルタイムで使用できます。

を使用してメディカルディクテーションの音声ストリームを書き起こしを選択してストリーミングを開始後、マイクに向かって会話を開始します。AWS Management Console

メディカルディクテーションの音声ストリームの書き起こし (AWS Management Console)
  1. AWS Management Consoleにサインインします。

  2. ナビゲーションペインのAmazon Transcribe Medical で、[リアルタイム文字起こし] を選択します。

  3. 医療専門分野 で、ストリームで話す臨床医の専門分野を選択します。

  4. 音声入力タイプ の場合、会話 または ディクテーション のいずれかを選択します。

  5. 追加設定 の場合、カスタムボキャブラリー を選択します。

    1. ボキャブラリー選択 で、カスタムボキャブラリーを選択します。

  6. [Start streaming] (ストリーミングの開始) を選択します。

  7. マイクに向かって話してください。

HTTP/2 リクエストのパラメータのための構文を次に示します。

POST /medical-stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com authorization: Generated value x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS x-amz-date: 20220208T235959Z x-amzn-transcribe-session-id: my-first-http2-med-stream x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-vocabulary-name: my-first-med-vocab x-amzn-transcribe-specialty: PRIMARYCARE x-amzn-transcribe-type: CONVERSATION x-amzn-transcribe-show-speaker-label: true Content-type: application/vnd.amazon.eventstream transfer-encoding: chunked

パラメータの説明のは次のとおりです。

  • host:AWS リージョン (前の例の 'us-west-2')AWS リージョン を呼び出しているもので更新します。有効なリストについてはAWS リージョン、「」AWS リージョンと「エンドポイント」を参照してください。

  • 権限:これは生成されたフィールドです。署名の作成の詳細については、「署名バージョン 4 で AWS リクエストに署名する」を参照してください。

  • x-amz-target: このフィールドは変更しないでください。前の例に示した内容を使用してください。

  • x-amz-content-sha256: これは生成されたフィールドです。署名の計算の詳細については、「署名バージョン 4 でAWSリクエストに署名する」を参照してください。

  • x-amz-date: 署名が作成された日付と時刻。形式は YYYYMMDDTHHMSSZ です。ここで、YYYYY=年、MM=月、DD=日、HH=時間、MM=分、SS=秒、「T」と「Z」は固定文字です。詳細については、「署名バージョン 4 における日付の処理」を参照してください。

  • x-amzn-transcribe-session-id: ストリーミングセッションの名前。

  • x-amzn-transcribe-language-code: 入力音声に使用されるエンコード。サポートされている言語および言語固有の機能有効な値のリストについては、StartMedicalStreamTranscriptionまたはを参照してください。

  • x-amzn-transcribe-media-encoding: 入力音声に使用されるエンコード。有効な値は、pcmogg-opusflac です。

  • x-amzn-transcribe-sample-rate: 入力音声のサンプルレート (Hz 単位)。 Amazon Transcribe8,000 Hz ~ 48,000 Hz の範囲をサポートします。電話の音声などの低品質のオーディオは、通常約 8,000 Hz です。高品質のオーディオは、通常 16,000 Hz から 48,000 Hz の範囲です。指定するサンプルレートは、オーディオのサンプルレートと一致する必要があることに注意してください

  • x-amzn-transcribe-vocabulary-name: 文字起こしで使いたい語彙の名前。

  • x-amzn-transcribe-specialty: 転記中の医療専門分野。

  • x-amzn-transcribe-type: これがディクテーションか会話かを選択します。

  • x-amzn-transcribe-show-speaker-label: ダイアライゼーションを有効にするには、この値をにする必要がありますtrue

  • content-type: このフィールドは変更しないでください。前の例で示した内容を使用してください。

API WebSocket を使用してストリーム内の話者を分割する場合、 WebSocket vocabulary-name次の形式を使用してリクエストをスタートするための署名付き URI を作成し、

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket ?language-code=en-US &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=Signature Version 4 signature &X-Amz-SignedHeaders=host &media-encoding=flac &sample-rate=16000 &session-id=sessionId &specialty=medicalSpecialty &type=CONVERSATION &vocabulary-name=vocabularyName &show-speaker-label=boolean