オーディオファイルPHIでの識別 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

オーディオファイルPHIでの識別

バッチ文字起こしジョブを使用して、オーディオファイルを文字起こししし、その中の個人健康情報 (PHI) を識別します。個人健康情報 (PHI) 識別を有効にすると、 Amazon Transcribe Medical は文字起こし結果で識別PHIした にラベルを付けます。 Amazon Transcribe Medical PHIが識別できる の詳細については、「」を参照してください文字起こしにおける個人の健康情報 (PHI) の特定

バッチ文字起こしジョブは、 StartMedicalTranscriptionJobAPIまたは を使用して開始できます AWS Management Console。

を使用して臨床医と患者の対話を AWS Management Console 文字起こしするには、文字起こしジョブを作成し、音声入力タイプ の会話を選択します。

オーディオファイルを文字起こしして識別するには PHI (AWS Management Console)
  1. AWS Management Consoleにサインインします。

  2. ナビゲーションペインの Amazon Transcribe Medical で、文字起こしジョブ を選択します。

  3. [ジョブの作成] を選択します。

  4. [ジョブ詳細を指定] ページ内の [ジョブ設定] で次の指定を行います。

    1. 名前 – に固有の文字起こしジョブの名前 AWS アカウント。

    2. 音声入力タイプ – [会話] または [ディクテーション]。

  5. 残りのフィールドでは、オーディオファイル Amazon S3 の場所と、文字起こしジョブの出力を保存する場所を指定します。

  6. [Next (次へ)] を選択します。

  7. オーディオ設定 で、PHI識別 を選択します。

  8. [Create] (作成) を選択します。

バッチ文字起こしジョブPHIを使用してオーディオファイルを文字起こしして識別するには (API)
  • StartMedicalTranscriptionJob にはAPI、以下を指定します。

    1. MedicalTranscriptionJobName の場合、 AWS アカウントに一意の名前を指定します。

    2. LanguageCode の場合、音声ファイルで話されている言語に対応する言語コードを指定します。

    3. MediaFileUri パラメータがあるMedia オブジェクトの場合、文字起こしを行う音声ファイルの名前を指定します。

    4. Specialty の場合、音声ファイルで話す臨床医の専門分野を PRIMARYCARE として指定します。

    5. Type の場合、CONVERSATION または DICTATION のいずれかを指定します。

    6. OutputBucketName の場合、文字起こし結果を保存する Amazon S3 バケットを指定します。

    以下は、 を使用して音声ファイルを AWS SDK for Python (Boto3) 文字起こししし、患者の PHI を識別するリクエストの例です。

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'DOC-EXAMPLE-BUCKET' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

次のコード例は、患者PHIを特定した文字起こし結果を示しています。

{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
バッチ文字起こしジョブPHIを使用してオーディオファイルを文字起こしして識別するには (AWS CLI)
  • 以下のコードを実行します。

    aws transcribe start-medical-transcription-job \ --medical-transcription-job-name my-medical-transcription-job-name\ --language-code en-US \ --media MediaFileUri="s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --specialty PRIMARYCARE \ --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation. --content-identification-type PHI