Identificazione delle PHI in un file audio

Utilizza un processo di trascrizione in batch per trascrivere file audio e identificare le informazioni sanitarie personali (PHI) al loro interno. Quando si attiva l'identificazione delle informazioni sanitarie personali (PHI), Amazon Transcribe Medical etichetta il PHI identificato nei risultati della trascrizione. Per informazioni sul PHI che Amazon Transcribe Medical può identificare, vedere. Identificazione delle informazioni sanitarie personali (PHI) in una trascrizione

Puoi avviare un processo di trascrizione in batch utilizzando l'API StartMedicalTranscriptionJob o la AWS Management Console.

Per utilizzarlo per trascrivere un dialogo tra medico e paziente, crea un processo di trascrizione e scegli Conversazione per il tipo di ingresso audio. AWS Management Console

Per trascrivere un file audio e identificarne le PHI (AWS Management Console)

Accedi alla AWS Management Console.
Nel riquadro di navigazione, in Medicina, scegli Lavori di trascrizione. Amazon Transcribe
Scegli Crea processo.
Nella pagina Specifica i dettagli del processo, sotto Impostazioni processo, specifica quanto segue.
1. Nome: il nome del lavoro di trascrizione che è unico per il tuo. Account AWS
2. Tipo di input audio: Conversazione o Dettatura.
Per i campi rimanenti, specificate la Amazon S3 posizione del file audio e dove desiderate memorizzare l'output del processo di trascrizione.
Scegli Next (Successivo).
In Impostazioni audio, scegli Identificazione PHI.
Scegli Create (Crea) .

Per trascrivere un file audio e identificarne le PHI utilizzando un processo di trascrizione in batch (API)

Per l'API StartMedicalTranscriptionJob, specifica quanto segue.

Per MedicalTranscriptionJobName, specifica un nome che sia unico per il tuo Account AWS.
Per LanguageCode, specifica il codice della lingua che corrisponde alla lingua parlata nel file audio.
Per il parametro MediaFileUri dell'oggetto Media, specifica il nome del file audio che vuoi trascrivere.
Per Specialty, specifica la specialità medica del medico che parla nel file audio come PRIMARYCARE.
Per Type, specifica CONVERSATION o DICTATION.
Per OutputBucketName, specifica il bucket Amazon S3 in cui archiviare i risultati della trascrizione.

Di seguito è riportato un esempio di richiesta che utilizza il AWS SDK per Python (Boto3) per trascrivere un file audio e identificare il PHI di un paziente.



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
transcribe.start_medical_transcription_job(
      MedicalTranscriptionJobName = job_name,
      Media = {'MediaFileUri': job_uri},
      LanguageCode = 'en-US',
      ContentIdentificationType = 'PHI',
      Specialty = 'PRIMARYCARE',
      Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation.
      OutputBucketName = 'amzn-s3-demo-bucket'
  )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Il codice di esempio seguente mostra i risultati della trascrizione con le PHI identificate del paziente.



{
    "jobName": "my-medical-transcription-job-name",
    "accountId": "111122223333",
    "results": {
        "transcripts": [{
            "transcript": "The patient's name is Bertrand."
        }],
        "items": [{
                "id": 0,
            "start_time": "0.0",
            "end_time": "0.37",
            "alternatives": [{
                "confidence": "0.9993",
                "content": "The"
            }],
            "type": "pronunciation"
        }, {
                "id": 1,
            "start_time": "0.37",
            "end_time": "0.44",
            "alternatives": [{
                "confidence": "0.9981",
                "content": "patient's"
            }],
            "type": "pronunciation"
        }, {
                "id": 2,
            "start_time": "0.44",
            "end_time": "0.52",
            "alternatives": [{
                "confidence": "1.0",
                "content": "name"
            }],
            "type": "pronunciation"
        }, {
                "id": 3,
            "start_time": "0.52",
            "end_time": "0.92",
            "alternatives": [{
                "confidence": "1.0",
                "content": "is"
            }],
            "type": "pronunciation"
        }, {
                "id": 4,
            "start_time": "0.92",
            "end_time": "0.9989",
            "alternatives": [{
                "confidence": "1.0",
                "content": "Bertrand"
            }],
            "type": "pronunciation"
        }, {
                "id": 5,
            "alternatives": [{
                "confidence": "0.0",
                "content": "."
            }],
            "type": "punctuation"
        }],
        "entities": [{
            "content": "Bertrand",
            "category": "PHI*-Personal*",
            "startTime": 0.92,
            "endTime": 1.2,
            "confidence": 0.9989
        }],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "The patient's name is Bertrand.",
                "start_time": "0.0",
                "end_time": "0.9989",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4,
                    5
                ]
            }
        ]
    },
    "status": "COMPLETED"
}

Trascrivere un file audio e identificare le PHI utilizzando un processo di trascrizione in batch (AWS CLI)

Eseguire il seguente codice.


aws transcribe start-medical-transcription-job \
--medical-transcription-job-name my-medical-transcription-job-name\
--language-code en-US \
--media MediaFileUri="s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" \
--output-bucket-name amzn-s3-demo-bucket \
--specialty PRIMARYCARE \
--type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation.
--content-identification-type PHI

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Identificazione delle PHI in una trascrizione

Identificazione delle PHI in un flusso in tempo reale