Transcrevendo um stream em tempo real usando um vocabulário médico personalizado - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Transcrevendo um stream em tempo real usando um vocabulário médico personalizado

Para melhorar a precisão da transcrição em um stream em tempo real, você pode usar um vocabulário personalizado usando HTTP/2 ou WebSocket streams. Para iniciar uma solicitação HTTP/2, use a StartMedicalStreamTranscriptionAPI. Você pode usar um vocabulário personalizado em tempo real usando a StartMedicalStreamTranscriptionAPI ou usando o WebSocket protocolo.AWS Management Console

Para usar oAWS Management Console para transcrever o streaming de áudio de um ditado médico, escolha a opção de transcrever um ditado médico, iniciar a transmissão e começar a falar no microfone.

Para transcrever o streaming de áudio de um ditado médico (AWS Management Console)
  1. Faça login no AWS Management Console.

  2. No painel de navegação, emAmazon Transcribe Médico, escolha Transcrição em tempo real.

  3. Para especialidade médica, escolha a especialidade médica do médico que fala no stream.

  4. Para Tipo de entrada de áudio, escolha Conversa ou Ditado.

  5. Para Configurações adicionais, escolha Vocabulário personalizado.

    1. Para Seleção de vocabulário, escolha o vocabulário personalizado.

  6. Selecione Start streaming (Iniciar transmissão).

  7. Fale no microfone.

Veja a seguir a sintaxe dos parâmetros de uma solicitação HTTP/2.

POST /medical-stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com authorization: Generated value x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS x-amz-date: 20220208T235959Z x-amzn-transcribe-session-id: my-first-http2-med-stream x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-vocabulary-name: my-first-med-vocab x-amzn-transcribe-specialty: PRIMARYCARE x-amzn-transcribe-type: CONVERSATION x-amzn-transcribe-show-speaker-label: true Content-type: application/vnd.amazon.eventstream transfer-encoding: chunked

Descrições dos parâmetros:

  • host: atualize oRegião da AWS ('us-west-2' no exemplo anterior) com oRegião da AWS que você está chamando. Para obter uma lista de pontos válidosRegiões da AWS, consulte Regiões da AWSe Endpoints.

  • autorização: Esse é um campo gerado. Para saber mais sobre como criar uma assinatura, consulte Assinatura de AWSsolicitações com a versão 4 do Signature.

  • x-amz-target: Não altere esse campo; use o conteúdo mostrado no exemplo anterior.

  • x-amz-content-sha256: Esse é um campo gerado. Para saber mais sobre como calcular uma assinatura, consulte Assinatura de AWSsolicitações com a versão 4 do Signature.

  • x-amz-date: a data e a hora em que a assinatura é criada. O formato é YYYYMMDDTHHMMSSZ, onde YYYY=ano, MM=mês, DD=dia, HH=hora, MM=minuto, SS=segundos e 'T' e 'Z' são caracteres fixos. Para obter mais informações, consulte Processamento de datas na versão 4 do Signature.

  • x-amzn-transcribe-session-id: o nome da sua sessão de streaming.

  • x-amzn-transcribe-language-code: a codificação usada para seu áudio de entrada. Consulte StartMedicalStreamTranscriptionouIdiomas oferecidos e recursos específicos do idioma para obter uma lista de valores válidos.

  • x-amzn-transcribe-media-encoding: A codificação usada para o áudio de entrada. Os valores válidos são pcm, ogg-opus e flac.

  • x-amzn-transcribe-sample-rate: A taxa de amostragem do áudio de entrada (em Hertz). Amazon Transcribesuporta uma faixa de 8.000 Hz a 48.000 Hz. O áudio de baixa qualidade, como o áudio do telefone, normalmente está em torno de 8.000 Hz. O áudio de alta qualidade geralmente varia de 16.000 Hz a 48.000 Hz. Observe que a taxa de amostragem especificada deve corresponder à do seu áudio.

  • x-amzn-transcribe-vocabulary-name: O nome do vocabulário que você deseja usar com sua transcrição.

  • x-amzn-transcribe-specialty: A especialidade médica que está sendo transcrita.

  • x-amzn-transcribe-type: Escolha se isso é um ditado ou uma conversa.

  • x-amzn-transcribe-show-speaker-label: para ativar a diarização, esse valor deve sertrue.

  • tipo de conteúdo: não altere esse campo; use o conteúdo mostrado no exemplo anterior.

Para particionar alto-falantes em WebSocket streams com a API, use o formato a seguir para criar um URI pré-assinado para iniciar uma WebSocket solicitação e definirvocabulary-name o nome do vocabulário personalizado.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket ?language-code=en-US &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=Signature Version 4 signature &X-Amz-SignedHeaders=host &media-encoding=flac &sample-rate=16000 &session-id=sessionId &specialty=medicalSpecialty &type=CONVERSATION &vocabulary-name=vocabularyName &show-speaker-label=boolean