StartMedicalStreamTranscription - Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

StartMedicalStreamTranscription

Inicia um HTTP/2 ou WebSocket stream bidirecional em que o áudio é transmitido para o Amazon Transcribe Medical e os resultados da transcrição são transmitidos para o aplicativo.

Os seguintes parâmetros são obrigatórios:

  • language-code

  • media-encoding

  • sample-rate

Para obter mais informações sobre streaming com o Amazon Transcribe Medical, consulte Transcrição de streaming de áudio.

Sintaxe da solicitação

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

Parâmetros da solicitação de URI

A solicitação usa os parâmetros de URI a seguir.

ContentIdentificationType

Rotula todas as informações de saúde pessoal (PHI) identificadas em sua transcrição.

A identificação do conteúdo é realizada no nível do segmento; o PHI é sinalizado após a transcrição completa de um segmento de áudio.

Para obter mais informações, consulte Identificação de informações pessoais de saúde (PHI) em uma transcrição.

Valores válidos: PHI

EnableChannelIdentification

Permite a identificação de canais em áudio multicanal.

A identificação do canal transcreve o áudio em cada canal de forma independente e, em seguida, acrescenta a saída de cada canal em uma transcrição.

Se você tiver áudio multicanal e não habilitar a identificação de canais, seu áudio será transcrito de forma contínua e sua transcrição não será separada por canal.

Se você incluirEnableChannelIdentification em sua solicitação, também deverá incluirNumberOfChannels.

Para obter mais informações, consulte Transcrever áudio de vários canais.

LanguageCode

Especifique o código do idioma que representa o idioma falado em seu áudio.

Importante

O Amazon Transcribe Medical só oferece suporte ao inglês dos EUA (en-US).

Valores válidos: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

Obrigatório: Sim

MediaEncoding

Especifique a codificação usada para o áudio de entrada. Os formatos com suporte são:

  • FLAC

  • Áudio codificado em Opus em um contêiner Ogg

  • PCM (somente formatos de áudio little-endian de 16 bits assinados, que não incluem WAV)

Para obter mais informações, consulte Formatos de mídia.

Valores válidos: pcm | ogg-opus | flac

Obrigatório: Sim

MediaSampleRateHertz

A taxa de amostragem do áudio de entrada (em hertz). O Amazon Transcribe Medical suporta uma faixa de 16.000 Hz a 48.000 Hz. Observe que a taxa de amostragem especificada deve corresponder à do seu áudio.

Intervalo válido: valor mínimo de 8000. Valor máximo de 48000.

Obrigatório: Sim

NumberOfChannels

Especifique o número de canais em sua transmissão de áudio. Esse valor deve ser2, pois somente dois canais são suportados. Se o áudio não contiver vários canais, não inclua esse parâmetro em sua solicitação.

Se você incluirNumberOfChannels em sua solicitação, também deverá incluirEnableChannelIdentification.

Intervalo válido: valor mínimo de 2.

SessionId

Especifique um nome para sua sessão de transcrição. Se você não incluir esse parâmetro em sua solicitação, o Amazon Transcribe Medical gerará uma ID e a retornará na resposta.

Restrições de comprimento: comprimento fixo de 36.

Padrão: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Permite o particionamento de alto-falantes (diarização) em sua saída de transcrição. O particionamento de alto-falantes rotula a fala de alto-falantes individuais em seu arquivo de mídia.

Para obter mais informações, consulte Partitioning speakers (diarização).

Specialty

Especifique a especialidade médica contida em seu áudio.

Valores válidos: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Obrigatório: Sim

Type

Especifique o tipo de entrada de áudio. Por exemplo, escolhaDICTATION um provedor ditando as anotações do paciente eCONVERSATION um diálogo entre um paciente e um profissional médico.

Valores válidos: CONVERSATION | DICTATION

Obrigatório: Sim

VocabularyName

Especifique o nome do vocabulário personalizado que você deseja usar ao processar sua transcrição. Observe que os nomes do vocabulário diferenciam letras maiúsculas de minúsculas.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

Corpo da solicitação

A solicitação aceita os dados a seguir no formato JSON.

AudioStream

Um fluxo codificado de bolhas de áudio. Os fluxos de áudio são codificados como HTTP/2 ou quadros WebSocket de dados.

Para obter mais informações, consulte Transcrever streaming de áudio.

Tipo: objeto AudioStream

Obrigatório: Sim

Sintaxe da resposta

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

Elementos de resposta

Se a ação for bem-sucedida, o serviço reenviará uma resposta HTTP 200.

A resposta retorna os cabeçalhos HTTP a seguir.

ContentIdentificationType

Mostra se a identificação do conteúdo foi ativada para sua transcrição.

Valores válidos: PHI

EnableChannelIdentification

Mostra se a identificação do canal foi ativada para sua transcrição.

LanguageCode

Fornece o código de idioma que você especificou em sua solicitação. Deve ser en-US.

Valores válidos: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

MediaEncoding

Fornece a codificação de mídia que você especificou em sua solicitação.

Valores válidos: pcm | ogg-opus | flac

MediaSampleRateHertz

Fornece a taxa de amostragem que você especificou em sua solicitação.

Intervalo válido: valor mínimo de 8000. Valor máximo de 48000.

NumberOfChannels

Fornece o número de canais que você especificou em sua solicitação.

Intervalo válido: valor mínimo de 2.

RequestId

Fornece o identificador para sua solicitação de streaming.

SessionId

Fornece o identificador para sua sessão de transcrição.

Restrições de comprimento: comprimento fixo de 36.

Padrão: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Mostra se o particionamento do alto-falante foi ativado para sua transcrição.

Specialty

Fornece a especialidade médica que você especificou em sua solicitação.

Valores válidos: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

Fornece o tipo de áudio que você especificou em sua solicitação.

Valores válidos: CONVERSATION | DICTATION

VocabularyName

Fornece o nome do vocabulário personalizado que você especificou em sua solicitação.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

Os seguintes dados são retornados no formato JSON pelo serviço.

TranscriptResultStream

Fornece informações detalhadas sobre sua sessão de streaming.

Tipo: objeto MedicalTranscriptResultStream

Erros

Para obter informações sobre os erros comuns a todas as ações, consulteErros comuns.

BadRequestException

Um ou mais argumentos para aStartCallAnalyticsStreamTranscription operaçãoStartStreamTranscriptionStartMedicalStreamTranscription, ou não eram válidos. Por exemplo,MediaEncoding ouLanguageCode usou valores não suportados. Verifique os parâmetros especificados e tente fazer sua solicitação novamente.

Código de status HTTP: 400

ConflictException

Um novo stream começou com o mesmo ID de sessão. O fluxo atual foi encerrado.

Código de status HTTP: 409

InternalFailureException

Ocorreu um problema ao processar o áudio. O Amazon Transcribe encerrou o processamento.

Código de status HTTP: 500

LimitExceededException

Seu cliente ultrapassou um dos limites do Amazon Transcribe. Normalmente, esse é o limite de duração do áudio. Divida seu fluxo de áudio em partes menores e tente fazer sua solicitação novamente.

Código de status HTTP: 429

ServiceUnavailableException

O serviço está indisponível no momento. Experimente sua solicitação mais tarde.

Código de status HTTP: 503

Consulte também

Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos de linguagem, consulte o seguinte: