Mengidentifikasi PHI dalam file audio - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengidentifikasi PHI dalam file audio

Gunakan pekerjaan transkripsi batch untuk menyalin file audio dan mengidentifikasi informasi kesehatan pribadi (PHI) di dalamnya. Saat Anda mengaktifkan Identifikasi Informasi Kesehatan Pribadi (PHI), Amazon Transcribe Medis memberi label PHI yang diidentifikasi dalam hasil transkripsi. Untuk informasi tentang PHI yang dapat diidentifikasi oleh Amazon Transcribe Medis, lihatMengidentifikasi informasi kesehatan pribadi (PHI) dalam transkripsi.

Anda dapat memulai pekerjaan transkripsi batch menggunakan file StartMedicalTranscriptionJobAPIatau. AWS Management Console

Untuk menggunakan untuk AWS Management Console mentranskripsikan dialog klinis-pasien, buat pekerjaan transkripsi dan pilih Percakapan untuk jenis input Audio.

Untuk mentranskripsikan file audio dan mengidentifikasi PHI ()AWS Management Console
  1. Masuk ke AWS Management Console.

  2. Di panel navigasi, di bawah Amazon Transcribe Medis, pilih Pekerjaan transkripsi.

  3. Pilih Buat tugas.

  4. Pada halaman Tentukan detail pekerjaan, di bawah Pengaturan Job, tentukan yang berikut ini.

    1. Nama — Nama pekerjaan transkripsi yang unik untuk Anda Akun AWS.

    2. Jenis input audio - Percakapan atau Dikte.

  5. Untuk bidang yang tersisa, tentukan Amazon S3 lokasi file audio Anda dan di mana Anda ingin menyimpan output dari pekerjaan transkripsi Anda.

  6. Pilih Berikutnya.

  7. Di bawah Pengaturan audio, pilih PHIIdentifikasi.

  8. Pilih Buat.

Untuk mentranskripsikan file audio dan mengidentifikasinya PHI menggunakan pekerjaan transkripsi batch () API
  • Untuk StartMedicalTranscriptionJobAPI, tentukan yang berikut ini.

    1. UntukMedicalTranscriptionJobName, tentukan nama yang unik untuk Anda Akun AWS.

    2. UntukLanguageCode, tentukan kode bahasa yang sesuai dengan bahasa yang digunakan dalam file audio Anda.

    3. Untuk MediaFileUri parameter Media objek, tentukan nama file audio yang ingin Anda transkripsikan.

    4. UntukSpecialty, tentukan spesialisasi medis dokter yang berbicara dalam file audio sebagaiPRIMARYCARE.

    5. Untuk Type, tentukan salah satu, CONVERSATION atau DICTATION.

    6. UntukOutputBucketName, tentukan Amazon S3 bucket tempat Anda ingin menyimpan hasil transkripsi.

    Berikut ini adalah contoh permintaan yang menggunakan AWS SDK for Python (Boto3) untuk menyalin file audio dan mengidentifikasi pasien. PHI

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'DOC-EXAMPLE-BUCKET' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Kode contoh berikut menunjukkan hasil transkripsi dengan pasien PHI diidentifikasi.

{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
Untuk mentranskripsikan file audio dan mengidentifikasi PHI menggunakan tugas transkripsi batch ()AWS CLI
  • Jalankan kode berikut.

    aws transcribe start-medical-transcription-job \ --medical-transcription-job-name my-medical-transcription-job-name\ --language-code en-US \ --media MediaFileUri="s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --specialty PRIMARYCARE \ --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation. --content-identification-type PHI