Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Identificazione delle PHI in un file audio
Utilizza un processo di trascrizione in batch per trascrivere file audio e identificare le informazioni sanitarie personali (PHI) al loro interno. Quando si attiva l'identificazione delle informazioni sanitarie personali (PHI), Amazon Transcribe Medical etichetta il PHI identificato nei risultati della trascrizione. Per informazioni sul PHI che Amazon Transcribe Medical può identificare, vedere. Identificazione delle informazioni sanitarie personali (PHI) in una trascrizione
Puoi avviare un processo di trascrizione in batch utilizzando l'API StartMedicalTranscriptionJob
o la AWS Management Console.
Per utilizzarlo per trascrivere un dialogo tra medico e paziente, crea un processo di trascrizione e scegli Conversazione per il tipo di ingresso audio. AWS Management Console
Per trascrivere un file audio e identificarne le PHI (AWS Management Console)
-
Accedi alla AWS Management Console
. -
Nel riquadro di navigazione, in Medicina, scegli Lavori di trascrizione. Amazon Transcribe
-
Scegli Crea processo.
-
Nella pagina Specifica i dettagli del processo, sotto Impostazioni processo, specifica quanto segue.
-
Nome: il nome del lavoro di trascrizione che è unico per il tuo. Account AWS
-
Tipo di input audio: Conversazione o Dettatura.
-
-
Per i campi rimanenti, specificate la Amazon S3 posizione del file audio e dove desiderate memorizzare l'output del processo di trascrizione.
-
Scegli Next (Successivo).
-
In Impostazioni audio, scegli Identificazione PHI.
-
Scegli Create (Crea) .
Per trascrivere un file audio e identificarne le PHI utilizzando un processo di trascrizione in batch (API)
-
Per l'API
StartMedicalTranscriptionJob
, specifica quanto segue.-
Per
MedicalTranscriptionJobName
, specifica un nome che sia unico per il tuo Account AWS. -
Per
LanguageCode
, specifica il codice della lingua che corrisponde alla lingua parlata nel file audio. -
Per il parametro
MediaFileUri
dell'oggettoMedia
, specifica il nome del file audio che vuoi trascrivere. -
Per
Specialty
, specifica la specialità medica del medico che parla nel file audio comePRIMARYCARE
. -
Per
Type
, specificaCONVERSATION
oDICTATION
. -
Per
OutputBucketName
, specifica il bucket Amazon S3 in cui archiviare i risultati della trascrizione.
Di seguito è riportato un esempio di richiesta che utilizza il AWS SDK per Python (Boto3) per trascrivere un file audio e identificare il PHI di un paziente.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "
my-first-transcription-job
" job_uri = "s3://amzn-s3-demo-bucket
/my-input-files
/my-audio-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type
', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'amzn-s3-demo-bucket
' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
Il codice di esempio seguente mostra i risultati della trascrizione con le PHI identificate del paziente.
{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
Trascrivere un file audio e identificare le PHI utilizzando un processo di trascrizione in batch (AWS CLI)
-
Eseguire il seguente codice.
aws transcribe start-medical-transcription-job \ --medical-transcription-job-name
my-medical-transcription-job-name
\ --language-code en-US \ --media MediaFileUri="s3://amzn-s3-demo-bucket
/my-input-files
/my-audio-file
.flac
" \ --output-bucket-nameamzn-s3-demo-bucket
\ --specialty PRIMARYCARE \ --typetype
\ # ChooseCONVERSATION
to transcribe a medical conversation. ChooseDICTATION
to transcribe a medical dictation. --content-identification-type PHI