Identificação PHI em um arquivo de áudio - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Identificação PHI em um arquivo de áudio

Use um trabalho de transcrição em lote para transcrever arquivos de áudio e identificar as informações pessoais de saúde (PHI) contidas neles. Quando você ativa a Identificação de Informações Pessoais de Saúde (PHI), o Amazon Transcribe Medical rotula o PHI que identificou nos resultados da transcrição. Para obter informações sobre o PHI que o Amazon Transcribe Medical pode identificar, consulteIdentificação de informações pessoais de saúde (PHI) em uma transcrição.

Você pode iniciar um trabalho de transcrição em lote usando o StartMedicalTranscriptionJobAPIou o. AWS Management Console

Para usar o AWS Management Console para transcrever um diálogo médico-paciente, crie um trabalho de transcrição e escolha Conversação como tipo de entrada de áudio.

Para transcrever um arquivo de áudio e identificar seu PHI ()AWS Management Console
  1. Faça login no AWS Management Console.

  2. No painel de navegação, em Amazon Transcribe Medicina, escolha Trabalhos de transcrição.

  3. Escolha Criar trabalho.

  4. Na página Especificar os detalhes da tarefa, em Configurações de tarefa, especifique as configurações a seguir.

    1. Nome — O nome do trabalho de transcrição que é exclusivo para você Conta da AWS.

    2. Tipo de entrada de áudio: Conversa ou Ditado.

  5. Para os campos restantes, especifique a Amazon S3 localização do seu arquivo de áudio e onde você deseja armazenar a saída do seu trabalho de transcrição.

  6. Escolha Próximo.

  7. Em Configurações de áudio, escolha PHIIdentificação.

  8. Escolha Criar.

Para transcrever um arquivo de áudio e identificá-lo PHI usando um trabalho de transcrição em lote () API
  • Para o StartMedicalTranscriptionJobAPI, especifique o seguinte.

    1. Para MedicalTranscriptionJobName, especifique um nome que seja exclusivo de sua Conta da AWS.

    2. Em LanguageCode, especifique o código do idioma que corresponde ao idioma falado no arquivo de áudio.

    3. Para o parâmetro MediaFileUri do objeto Media, especifique o nome do arquivo de áudio que você deseja transcrever.

    4. Para Specialty, especifique a especialidade médica do médico que está se pronunciando no arquivo de áudio como PRIMARYCARE.

    5. Para o Type, especifique CONVERSATION ou DICTATION.

    6. Em OutputBucketName, especifique o bucket do Amazon S3 onde você deseja armazenar os resultados da transcrição.

    A seguir está um exemplo de solicitação que usa o AWS SDK for Python (Boto3) para transcrever um arquivo de áudio e identificar o PHI de um paciente.

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'DOC-EXAMPLE-BUCKET' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

O código de exemplo a seguir mostra os resultados da transcrição com o paciente PHI identificado.

{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
Para transcrever um arquivo de áudio e identificá-lo PHI usando um trabalho de transcrição em lote ()AWS CLI
  • Execute o código a seguir.

    aws transcribe start-medical-transcription-job \ --medical-transcription-job-name my-medical-transcription-job-name\ --language-code en-US \ --media MediaFileUri="s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --specialty PRIMARYCARE \ --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation. --content-identification-type PHI