翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
オーディオファイル内の PHI の識別
バッチトランスクリプションジョブを使用して、オーディオファイルを書き起こし、その中 の個人の健康情報 (PHI) を特定します。個人のHealth 情報 (PHI を識別する) を有効にすると、Amazon Transcribe Medical はトランスクリプション結果で識別した PHI ににラベル付けします。Amazon TranscribeMedical が識別できる PHI の詳細については、「」を参照してくださいトランスクリプションにおける個人の健康情報 (PHI) の特定。
StartMedicalTranscriptionJob
API またはのいずれかを使用して、バッチ文字起こしジョブを開始することができますAWS Management Console。
AWS Management Consoleを使用して臨床医と患者の対話を書き起こす場合、文字起こしジョブを作成し、オーディオ入力タイプの会話を選択します。
オーディオファイルを書き起こし、そのAWS Management Console PHI を識別するには、
-
AWS Management Console
にサインインします。 -
ナビゲーションペインの [Amazon Transcribe医療] で、[文字起こしジョブ] を選択します。
-
[Create job (ジョブの作成)] を選択します。
-
[ジョブ詳細を指定] ページ内の [ジョブ設定] で次の指定を行います。
-
名前 - お客様の AWS アカウント に固有のトランスクリプションジョブの名前。
-
オーディオ入力タイプ – [会話] または [ディクテーション]。
-
-
残りのフィールドには、Amazon S3オーディオファイルの場所と、文字起こしジョブの出力を保存する場所を指定します。
-
[Next] (次へ) を選択します。
-
[オーディオ設定]で、[PHI 識別] を選択します。
-
[作成] を選択します。
バッチトランスクリプションジョブ (API) を使用してオーディオファイルを書き起こし、その PHI を識別するには、
-
StartMedicalTranscriptionJob
API では、以下のものを指定します。-
には
MedicalTranscriptionJobName
、自分だけの名前を指定してくださいAWS アカウント。 -
LanguageCode
の場合、オーディオファイルで話されている言語に対応する言語コードを指定します。 -
MediaFileUri
パラメータがあるMedia
オブジェクトの場合、文字起こしを行うオーディオファイルの名前を指定します。 -
Specialty
の場合、音声ファイルで話す臨床医の専門分野をPRIMARYCARE
として指定します。 -
Type
を使用する場合で、CONVERSATION
とDICTATION
のいずれかを指定します。 -
の場合
OutputBucketName
、Amazon S3トランスクリプション結果を保存するバケットを指定します。
以下は、リクエストの例です。オーディオファイルを書き起こし、患者の PHI を識別するために AWS SDK for Python (Boto3) を使用します。
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "
my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-audio-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type
', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'DOC-EXAMPLE-BUCKET
' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
次のコード例は、患者 PHI を識別した場合のトランスクリプションの結果を示しています。
{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], }, "status": "COMPLETED" }
バッチトランスクリプションジョブ (AWS CLI) を使用してオーディオファイルを書き起こし、その PHI を識別するには
-
以下の コードを実行します。
aws transcribe start-medical-transcription-job \ --medical-transcription-job-name
my-medical-transcription-job-name
\ --language-code en-US \ --media MediaFileUri="s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-audio-file
.flac
" \ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --specialty PRIMARYCARE \ --typetype
\ # ChooseCONVERSATION
to transcribe a medical conversation. ChooseDICTATION
to transcribe a medical dictation. --content-identification-type PHI