Transcrever um fluxo em tempo real usando um vocabulário médico personalizado

Para melhorar a precisão da transcrição em um stream em tempo real, você pode usar um vocabulário personalizado usando HTTP/2 ou streams. WebSocket Para iniciar uma solicitação HTTP/2, use a API StartMedicalStreamTranscription. Você pode usar um vocabulário personalizado em tempo real usando a StartMedicalStreamTranscriptionAPI ou usando o WebSocket protocolo. AWS Management Console

Para usar o AWS Management Console para transcrever o streaming de áudio de um ditado médico, escolha a opção de transcrever um ditado médico, iniciar a transmissão e começar a falar no microfone.

Como transcrever o streaming de áudio de um ditado médico (AWS Management Console)

Faça login no AWS Management Console.
No painel de navegação, em Amazon Transcribe Médico, escolha Transcrição em tempo real.
Em Especialidade médica, escolha a especialidade médica do médico que está se pronunciando no fluxo.
Em Tipo de entrada de áudio, escolha Conversa ou Ditado.
Em Configurações adicionais, escolha Vocabulário personalizado.
1. Em Seleção de vocabulário, escolha o vocabulário personalizado.
Selecione Start streaming (Iniciar transmissão).
Fale pelo microfone.

Veja a seguir a sintaxe dos parâmetros de uma solicitação HTTP/2.


POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked

Descrições dos parâmetros:

host: atualize o Região da AWS ('us-west-2' no exemplo anterior) com Região da AWS o que você está chamando. Para obter uma lista de pontos finais válidos Regiões da AWS, consulte Regiões da AWS Endpoints.
authorization: esse é um campo gerado. Para saber mais sobre como criar uma assinatura, consulte Assinando AWS solicitações com o Signature versão 4.
x-amz-target: não altere esse campo; use o conteúdo mostrado no exemplo anterior.
x-amz-content-sha256: Esse é um campo gerado. Para saber mais sobre o cálculo de uma assinatura, consulte Assinando AWS solicitações com o Signature versão 4.
x-amz-date: a data e a hora em que a assinatura foi criada. O formato é YYYYMMDDTHHMMSSZ, onde YYYY = ano, mm = mês, DD = dia, HH = hora, MM = minuto, SS = segundos e “T” e “Z” são caracteres fixos. Para obter mais informações, consulte Handling Dates in Signature Version 4.
x-amzn-transcribe-session-id: o nome da sua sessão de streaming.
x-amzn-transcribe-language-code: a codificação usada para o áudio de entrada. Consulte StartMedicalStreamTranscription ou Idiomas oferecidos e recursos específicos do idioma para obter uma lista de valores válidos.
x-amzn-transcribe-media-encoding: a codificação usada para o áudio de entrada. Os valores válidos são pcm, ogg-opus e flac.
x-amzn-transcribe-sample-rate: A taxa de amostragem do áudio de entrada (em Hertz). Amazon Transcribe suporta uma faixa de 8.000 Hz a 48.000 Hz. O áudio de baixa qualidade, como o áudio telefônico, normalmente gira em torno de 8.000 Hz. Áudio de alta qualidade normalmente varia de 16.000 Hz a 48.000 Hz. Observe que a taxa de amostragem especificada deve corresponder à do áudio.
x-amzn-transcribe-vocabulary-name: o nome do vocabulário que você deseja usar com sua transcrição.
x-amzn-transcribe-specialty: A especialidade médica que está sendo transcrita.
x-amzn-transcribe-type: escolha se isso é um ditado ou uma conversa.
x-amzn-transcribe-show-speaker-label: para habilitar a diarização, esse valor deve ser. true
content-type: não altere esse campo; use o conteúdo mostrado no exemplo anterior.

Para particionar alto-falantes em WebSocket streams com a API, use o formato a seguir para criar um URI pré-assinado para iniciar uma WebSocket solicitação e vocabulary-name definir o nome do vocabulário personalizado.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Transcrever um arquivo de áudio usando um vocabulário médico personalizado

Conjunto de caracteres para Amazon Transcribe Medicina