Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengidentifikasi PHI dalam file audio
Gunakan pekerjaan transkripsi batch untuk menyalin file audio dan mengidentifikasi informasi kesehatan pribadi (PHI) di dalamnya. Saat Anda mengaktifkan Identifikasi Informasi Kesehatan Pribadi (PHI), Amazon Transcribe Medis memberi label PHI yang diidentifikasi dalam hasil transkripsi. Untuk informasi tentang PHI yang dapat diidentifikasi oleh Amazon Transcribe Medis, lihatMengidentifikasi informasi kesehatan pribadi (PHI) dalam transkripsi.
Anda dapat memulai pekerjaan transkripsi batch menggunakan file StartMedicalTranscriptionJob
APIatau. AWS Management Console
Untuk menggunakan untuk AWS Management Console mentranskripsikan dialog klinis-pasien, buat pekerjaan transkripsi dan pilih Percakapan untuk jenis input Audio.
Untuk mentranskripsikan file audio dan mengidentifikasi PHI ()AWS Management Console
-
Masuk ke AWS Management Console
. -
Di panel navigasi, di bawah Amazon Transcribe Medis, pilih Pekerjaan transkripsi.
-
Pilih Buat tugas.
-
Pada halaman Tentukan detail pekerjaan, di bawah Pengaturan Job, tentukan yang berikut ini.
-
Nama — Nama pekerjaan transkripsi yang unik untuk Anda Akun AWS.
-
Jenis input audio - Percakapan atau Dikte.
-
-
Untuk bidang yang tersisa, tentukan Amazon S3 lokasi file audio Anda dan di mana Anda ingin menyimpan output dari pekerjaan transkripsi Anda.
-
Pilih Berikutnya.
-
Di bawah Pengaturan audio, pilih PHIIdentifikasi.
-
Pilih Buat.
Untuk mentranskripsikan file audio dan mengidentifikasinya PHI menggunakan pekerjaan transkripsi batch () API
-
Untuk
StartMedicalTranscriptionJob
API, tentukan yang berikut ini.-
Untuk
MedicalTranscriptionJobName
, tentukan nama yang unik untuk Anda Akun AWS. -
Untuk
LanguageCode
, tentukan kode bahasa yang sesuai dengan bahasa yang digunakan dalam file audio Anda. -
Untuk
MediaFileUri
parameterMedia
objek, tentukan nama file audio yang ingin Anda transkripsikan. -
Untuk
Specialty
, tentukan spesialisasi medis dokter yang berbicara dalam file audio sebagaiPRIMARYCARE
. -
Untuk
Type
, tentukan salah satu,CONVERSATION
atauDICTATION
. -
Untuk
OutputBucketName
, tentukan Amazon S3 bucket tempat Anda ingin menyimpan hasil transkripsi.
Berikut ini adalah contoh permintaan yang menggunakan AWS SDK for Python (Boto3) untuk menyalin file audio dan mengidentifikasi pasien. PHI
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "
my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-audio-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type
', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'DOC-EXAMPLE-BUCKET
' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
Kode contoh berikut menunjukkan hasil transkripsi dengan pasien PHI diidentifikasi.
{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
Untuk mentranskripsikan file audio dan mengidentifikasi PHI menggunakan tugas transkripsi batch ()AWS CLI
-
Jalankan kode berikut.
aws transcribe start-medical-transcription-job \ --medical-transcription-job-name
my-medical-transcription-job-name
\ --language-code en-US \ --media MediaFileUri="s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-audio-file
.flac
" \ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --specialty PRIMARYCARE \ --typetype
\ # ChooseCONVERSATION
to transcribe a medical conversation. ChooseDICTATION
to transcribe a medical dictation. --content-identification-type PHI