As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Identificação PHI em um arquivo de áudio
Use um trabalho de transcrição em lote para transcrever arquivos de áudio e identificar as informações pessoais de saúde (PHI) contidas neles. Quando você ativa a Identificação de Informações Pessoais de Saúde (PHI), o Amazon Transcribe Medical rotula o PHI que identificou nos resultados da transcrição. Para obter informações sobre o PHI que o Amazon Transcribe Medical pode identificar, consulteIdentificação de informações pessoais de saúde (PHI) em uma transcrição.
Você pode iniciar um trabalho de transcrição em lote usando o StartMedicalTranscriptionJob
APIou o. AWS Management Console
Para usar o AWS Management Console para transcrever um diálogo médico-paciente, crie um trabalho de transcrição e escolha Conversação como tipo de entrada de áudio.
Para transcrever um arquivo de áudio e identificar seu PHI ()AWS Management Console
-
Faça login no AWS Management Console
. -
No painel de navegação, em Amazon Transcribe Medicina, escolha Trabalhos de transcrição.
-
Escolha Criar trabalho.
-
Na página Especificar os detalhes da tarefa, em Configurações de tarefa, especifique as configurações a seguir.
-
Nome — O nome do trabalho de transcrição que é exclusivo para você Conta da AWS.
-
Tipo de entrada de áudio: Conversa ou Ditado.
-
-
Para os campos restantes, especifique a Amazon S3 localização do seu arquivo de áudio e onde você deseja armazenar a saída do seu trabalho de transcrição.
-
Escolha Próximo.
-
Em Configurações de áudio, escolha PHIIdentificação.
-
Escolha Criar.
Para transcrever um arquivo de áudio e identificá-lo PHI usando um trabalho de transcrição em lote () API
-
Para o
StartMedicalTranscriptionJob
API, especifique o seguinte.-
Para
MedicalTranscriptionJobName
, especifique um nome que seja exclusivo de sua Conta da AWS. -
Em
LanguageCode
, especifique o código do idioma que corresponde ao idioma falado no arquivo de áudio. -
Para o parâmetro
MediaFileUri
do objetoMedia
, especifique o nome do arquivo de áudio que você deseja transcrever. -
Para
Specialty
, especifique a especialidade médica do médico que está se pronunciando no arquivo de áudio comoPRIMARYCARE
. -
Para o
Type
, especifiqueCONVERSATION
ouDICTATION
. -
Em
OutputBucketName
, especifique o bucket do Amazon S3 onde você deseja armazenar os resultados da transcrição.
A seguir está um exemplo de solicitação que usa o AWS SDK for Python (Boto3) para transcrever um arquivo de áudio e identificar o PHI de um paciente.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "
my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-audio-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type
', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'DOC-EXAMPLE-BUCKET
' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
O código de exemplo a seguir mostra os resultados da transcrição com o paciente PHI identificado.
{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
Para transcrever um arquivo de áudio e identificá-lo PHI usando um trabalho de transcrição em lote ()AWS CLI
-
Execute o código a seguir.
aws transcribe start-medical-transcription-job \ --medical-transcription-job-name
my-medical-transcription-job-name
\ --language-code en-US \ --media MediaFileUri="s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-audio-file
.flac
" \ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --specialty PRIMARYCARE \ --typetype
\ # ChooseCONVERSATION
to transcribe a medical conversation. ChooseDICTATION
to transcribe a medical dictation. --content-identification-type PHI