StartCallAnalyticsStreamTranscription - Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

StartCallAnalyticsStreamTranscription

Inicia una WebSocket transmisión o transmisión de HTTP/2 bidireccional donde el audio se transmite a Amazon Transcribe y los resultados de la transcripción se transmiten a la aplicación. Utilice esta operación para las transcripciones de Call Analytics.

Se requieren los siguientes parámetros:

  • language-code

  • media-encoding

  • sample-rate

Para obtener más información sobre la transmisión con Amazon Transcribe, consulte Transcribir audio en streaming.

Sintaxis de la solicitud

POST /call-analytics-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability x-amzn-transcribe-content-identification-type: ContentIdentificationType x-amzn-transcribe-content-redaction-type: ContentRedactionType x-amzn-transcribe-pii-entity-types: PiiEntityTypes Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob }, "ConfigurationEvent": { "ChannelDefinitions": [ { "ChannelId": number, "ParticipantRole": "string" } ], "PostCallAnalyticsSettings": { "ContentRedactionOutput": "string", "DataAccessRoleArn": "string", "OutputEncryptionKMSKeyId": "string", "OutputLocation": "string" } } } }

Parámetros de solicitud del URI

La solicitud utiliza los siguientes parámetros URI.

ContentIdentificationType

Otorga una etiqueta a toda la información de identificación personal (PII, por sus siglas en inglés) identificada en la transcripción.

La identificación del contenido se realiza a nivel de segmento; la PII especificada enPiiEntityTypes se marca cuando se completa la transcripción de un segmento de audio.

No puedes configurarContentIdentificationType yContentRedactionType en la misma solicitud. Si configuras ambos, tu solicitud devuelve unBadRequestException.

Para obtener más información, consulte Redactar o identificar información de identificación personal.

Valores válidos: PII

ContentRedactionType

Redacta toda la información de identificación personal (PII, por sus siglas en inglés) identificada en la transcripción.

La redacción del contenido se realiza a nivel de segmento; la PII especificada enPiiEntityTypes se redacta tras la transcripción completa de un segmento de audio.

No puedes configurarContentRedactionType yContentIdentificationType en la misma solicitud. Si configuras ambos, tu solicitud devuelve unBadRequestException.

Para obtener más información, consulte Redactar o identificar información de identificación personal.

Valores válidos: PII

EnablePartialResultsStabilization

Permite la estabilización parcial de los resultados de la transcripción. La estabilización parcial de los resultados puede reducir la latencia de la salida, pero puede afectar a la precisión. Para obtener más información, consulte Estabilización de resultados parciales.

LanguageCode

Especifique el código de idioma que representa el idioma que se habla en el audio.

Si no estás seguro del idioma que se habla en el audio, considera la posibilidad deIdentifyLanguage habilitar la identificación automática del idioma.

Para obtener una lista de los idiomas compatibles con el análisis de llamadas en tiempo real, consulte la tabla de idiomas compatibles.

Valores válidos: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR

Obligatorio: sí

LanguageModelName

Especifique el nombre del modelo de idioma personalizado que desea utilizar al procesar la transcripción. Tenga en cuenta que los nombres de modelo de idioma distinguen entre mayúsculas y minúsculas.

El idioma del modelo de idioma especificado debe coincidir con el código de idioma que especifique en la solicitud de transcripción. Si los idiomas no coinciden, no se aplica el modelo de idioma personalizado. No hay errores ni advertencias asociados a la falta de coincidencia de idiomas.

Para obtener más información, consulte Modelos de idioma personalizados.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

MediaEncoding

Especifique la codificación del audio de entrada. Los formatos admitidos son:

  • FLAC

  • Audio codificado en OPUS en un contenedor Ogg

  • PCM (solo formatos de audio little-endian firmados de 16 bits, que no incluyen WAV)

Para obtener más información, consulte Formatos de medios.

Valores válidos: pcm | ogg-opus | flac

Obligatorio: sí

MediaSampleRateHertz

La frecuencia de muestreo del audio de entrada (en hercios). El audio de baja calidad, como el audio del teléfono, suele rondar los 8.000 Hz. El audio de alta calidad suele oscilar entre 16.000 Hz y 48.000 Hz. Tenga en cuenta que la frecuencia de muestreo que especifique debe coincidir con la del audio.

Rango válido: valor mínimo de 8000. Valor máximo de 48000.

Obligatorio: sí

PartialResultsStability

Especifique el nivel de estabilidad que se utilizará al habilitar la estabilización de resultados parciales (EnablePartialResultsStabilization).

La baja estabilidad proporciona la máxima precisión. La alta estabilidad transcribe más rápido, pero con una precisión ligeramente inferior.

Para obtener más información, consulte Estabilización de resultados parciales.

Valores válidos: high | medium | low

PiiEntityTypes

Especifique qué tipos de información de identificación personal (PII) desea redactar en su expediente académico. Puede incluir tantos tipos como desee o puede seleccionarALL.

ParaPiiEntityTypes incluirlo en su solicitud de análisis de llamadas, también debe incluir unoContentIdentificationType oContentRedactionType.

Los valores deben estar separados por comas y pueden incluir:ADDRESSBANK_ACCOUNT_NUMBERBANK_ROUTING,CREDIT_DEBIT_CVV,CREDIT_DEBIT_EXPIRY,CREDIT_DEBIT_NUMBER,EMAILNAME,PHONE,PIN,SSN, oALL.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 300 caracteres.

Patrón: ^[A-Z_, ]+

SessionId

Especifique un nombre para la sesión de transcripción de Call Analytics. Si no incluye este parámetro en la solicitud, Amazon Transcribe genera un ID y lo devuelve en la respuesta.

Limitaciones de longitud: longitud fija de 36.

Patrón: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

VocabularyFilterMethod

Especifica cómo quieres que se aplique el filtro de vocabulario a tu expediente académico.

Para reemplazar palabras por***, elijamask.

Para eliminar palabras, elijaremove.

Para marcar palabras sin cambiarlas, eligetag.

Valores válidos: remove | mask | tag

VocabularyFilterName

Especifique el nombre del filtro de vocabulario personalizado que desea utilizar al procesar la transcripción. Tenga en cuenta que los nombres de filtro de vocabulario distinguen entre mayúsculas y minúsculas.

Si el idioma del filtro de vocabulario personalizado especificado no coincide con el idioma identificado en el contenido multimedia, el filtro de vocabulario no se aplica a la transcripción.

Para obtener más información, consulte Uso del filtrado de vocabulario con palabras no deseadas.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

VocabularyName

Especifique el nombre del vocabulario personalizado que desea utilizar al procesar la transcripción. Tenga en cuenta que los nombres de vocabulario distinguen entre mayúsculas y minúsculas.

Si el idioma del vocabulario personalizado especificado no coincide con el idioma identificado en el contenido multimedia, el vocabulario personalizado no se aplica a la transcripción.

Para obtener más información, consulte Vocabularios personalizados.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

Cuerpo de la solicitud

La solicitud acepta los siguientes datos en formato JSON.

AudioStream

Un flujo codificado de manchas de audio. Las transmisiones de audio se codifican como HTTP/2 o como tramas WebSocket de datos.

Para obtener más información, consulte Transcribir audio de streaming.

Tipo: objeto CallAnalyticsAudioStream

Obligatorio: sí

Sintaxis de la respuesta

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability x-amzn-transcribe-content-identification-type: ContentIdentificationType x-amzn-transcribe-content-redaction-type: ContentRedactionType x-amzn-transcribe-pii-entity-types: PiiEntityTypes Content-type: application/json { "CallAnalyticsTranscriptResultStream": { "BadRequestException": { }, "CategoryEvent": { "MatchedCategories": [ "string" ], "MatchedDetails": { "string" : { "TimestampRanges": [ { "BeginOffsetMillis": number, "EndOffsetMillis": number } ] } } }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "UtteranceEvent": { "BeginOffsetMillis": number, "EndOffsetMillis": number, "Entities": [ { "BeginOffsetMillis": number, "Category": "string", "Confidence": number, "Content": "string", "EndOffsetMillis": number, "Type": "string" } ], "IsPartial": boolean, "IssuesDetected": [ { "CharacterOffsets": { "Begin": number, "End": number } } ], "Items": [ { "BeginOffsetMillis": number, "Confidence": number, "Content": "string", "EndOffsetMillis": number, "Stable": boolean, "Type": "string", "VocabularyFilterMatch": boolean } ], "ParticipantRole": "string", "Sentiment": "string", "Transcript": "string", "UtteranceId": "string" } } }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

La respuesta devuelve los siguientes encabezados HTTP.

ContentIdentificationType

Muestra si la identificación de contenido estaba habilitada para la transcripción de Call Analytics.

Valores válidos: PII

ContentRedactionType

Muestra si la redacción de contenido estaba habilitada para la transcripción de Call Analytics.

Valores válidos: PII

EnablePartialResultsStabilization

Muestra si la estabilización parcial de los resultados estaba habilitada para la transcripción de Call Analytics.

LanguageCode

Proporciona el código de idioma que especificó en su solicitud de Call Analytics.

Valores válidos: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR

LanguageModelName

Proporciona el nombre del modelo de idioma personalizado que especificó en su solicitud de Call Analytics.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

MediaEncoding

Proporciona la codificación multimedia que especificó en su solicitud de Call Analytics.

Valores válidos: pcm | ogg-opus | flac

MediaSampleRateHertz

Proporciona la frecuencia de muestreo que especificó en su solicitud de Call Analytics.

Rango válido: valor mínimo de 8000. Valor máximo de 48000.

PartialResultsStability

Proporciona el nivel de estabilización utilizado para la transcripción.

Valores válidos: high | medium | low

PiiEntityTypes

Muestra los tipos de entidades de información personal que especificaste en tu solicitud de Call Analytics.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 300 caracteres.

Patrón: ^[A-Z_, ]+

RequestId

Proporciona el identificador de su solicitud de análisis de llamadas en tiempo real.

SessionId

Proporciona el identificador de la sesión de transcripción de Call Analytics.

Limitaciones de longitud: longitud fija de 36.

Patrón: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

VocabularyFilterMethod

Proporciona el método de filtrado de vocabulario utilizado en la transcripción de Call Analytics.

Valores válidos: remove | mask | tag

VocabularyFilterName

Proporciona el nombre del filtro de vocabulario personalizado que especificó en su solicitud de Call Analytics.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

VocabularyName

Proporciona el nombre del vocabulario personalizado que especificó en su solicitud de Call Analytics.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

El servicio devuelve los datos siguientes en formato JSON.

CallAnalyticsTranscriptResultStream

Proporciona información detallada sobre su sesión de análisis de llamadas en tiempo real.

Tipo: objeto CallAnalyticsTranscriptResultStream

Errores

Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.

BadRequestException

Uno o más argumentos de laStartCallAnalyticsStreamTranscription operaciónStartStreamTranscriptionStartMedicalStreamTranscription, o no eran válidos. Por ejemplo,MediaEncoding oLanguageCode usó valores no admitidos. Compruebe los parámetros especificados y vuelva a intentar realizar la solicitud.

Código de estado HTTP: 400

ConflictException

Se inició una nueva transmisión con el mismo ID de sesión. La transmisión actual ha finalizado.

Código de estado HTTP: 409

InternalFailureException

Se ha producido un problema al procesar el audio. Amazon Transcribe ha finalizado el procesamiento.

Código de estado HTTP: 500

LimitExceededException

Su cliente ha superado uno de los límites de Amazon Transcribe. Este suele ser el límite de longitud del audio. Divida la transmisión de audio en fragmentos más pequeños y vuelva a intentar realizar la solicitud.

Código de estado HTTP: 429

ServiceUnavailableException

El servicio no está disponible en este momento. Prueba tu solicitud más tarde.

Código de estado HTTP: 503

Véase también

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: