오디오 PHI 파일에서 식별
일괄 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 그 안에 있는 개인 건강 정보 (PHI) 를 식별할 수 있습니다. 개인 건강 정보 (PHI) 식별을 활성화하면 Amazon Transcribe 의료 PHI 부서는 기록 결과에서 식별된 내용을 라벨로 표시합니다. Amazon Transcribe 의료진이 식별할 수 PHI 있는 항목에 대한 자세한 내용은 을 참조하십시오트랜스크립션의 개인 건강 정보 (PHI) 식별.
API또는 를 사용하여 일괄 트랜스크립션 작업을 시작할 수 있습니다. AWS Management Console
를 사용하여 임상의와 환자의 대화를 텍스트로 AWS Management Console 변환하려면 트랜스크립션 작업을 생성하고 오디오 입력 유형을 위한 대화를 선택합니다.
오디오 파일을 텍스트로 변환하고 해당 파일을 식별하려면 () PHI AWS Management Console
AWS Management Console
에 로그인합니다. -
탐색 창의 Amazon Transcribe 의료에서 트랜스크립션 작업을 선택합니다.
작업 생성을 선택합니다.
DB 세부 정보 지정 페이지의 작업 설정에서 다음을 지정합니다.
이름 - 사용자 고유의 트랜스크립션 작업 이름입니다. AWS 계정
오디오 입력 유형 – 대화 또는 구술.
나머지 필드에는 오디오 파일의 Amazon S3 위치와 트랜스크립션 작업의 출력을 저장할 위치를 지정하십시오.
Next(다음)를 선택합니다.
오디오 설정에서 PHI 식별을 선택합니다.
생성(Create)을 선택합니다.
일괄 트랜스크립션 작업을 PHI 사용하여 오디오 파일을 트랜스크립션하고 식별하려면 () API
API경우 다음을 지정하십시오.-
에서 AWS 계정의 고유한 이름을 지정합니다. -
에는 오디오 파일에서 사용하는 언어에 해당하는 언어 코드를 지정합니다. -
파라미터에서 트랜스크립션할 오디오 파일의 이름을 지정합니다. -
에는 오디오 파일에서 말하는 임상의의 전문 분야를PRIMARYCARE
로 지정합니다. -
를 지정합니다. -
에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.
다음은 를 사용하여 오디오 파일을 녹음하고 환자의 신원을 확인하는 PHI 요청의 예입니다. AWS SDK for Python (Boto3)
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "
" job_uri = "s3://DOC-EXAMPLE-BUCKET
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type
', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'DOC-EXAMPLE-BUCKET
' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
다음 예제 코드는 환자를 PHI 식별한 상태에서의 트랜스크립션 결과를 보여줍니다.
{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
일괄 트랜스크립션 작업을 PHI 사용하여 오디오 파일을 트랜스크립션하고 식별하려면 ()AWS CLI
다음 코드를 실행합니다.
aws transcribe start-medical-transcription-job \ --medical-transcription-job-name
\ --language-code en-US \ --media MediaFileUri="s3://DOC-EXAMPLE-BUCKET
" \ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --specialty PRIMARYCARE \ --typetype
to transcribe a medical conversation. ChooseDICTATION
to transcribe a medical dictation. --content-identification-type PHI