Syntaxe de la demande Paramètres de demande URI Corps de la demande Syntaxe de la réponse Eléments de réponse Erreurs Voir aussi

StartStreamTranscription

Lance un HTTP/2 ou un WebSocket flux bidirectionnel où l'audio est diffusé en continu vers Amazon Transcribe et les résultats de la transcription sont diffusés sur votre application.

Les paramètres suivants sont obligatoires :

language-code ou identify-language
media-encoding
sample-rate

Pour plus d'informations sur le streaming avec Amazon Transcribe, consultez la section Transcription du streaming audio.

Syntaxe de la demande


POST /stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName
x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization
x-amzn-transcribe-partial-results-stability: PartialResultsStability
x-amzn-transcribe-content-identification-type: ContentIdentificationType
x-amzn-transcribe-content-redaction-type: ContentRedactionType
x-amzn-transcribe-pii-entity-types: PiiEntityTypes
x-amzn-transcribe-language-model-name: LanguageModelName
x-amzn-transcribe-identify-language: IdentifyLanguage
x-amzn-transcribe-language-options: LanguageOptions
x-amzn-transcribe-preferred-language: PreferredLanguage
x-amzn-transcribe-vocabulary-names: VocabularyNames
x-amzn-transcribe-vocabulary-filter-names: VocabularyFilterNames
Content-type: application/json

{
   "AudioStream": { 
      "AudioEvent": { 
         "AudioChunk": blob
      }
   }
}

Paramètres de demande URI

La demande utilise les paramètres URI suivants.

ContentIdentificationType

Étiquette toutes les données d'identification personnelle (PII) identifiées sur votre relevé de notes.

L'identification du contenu est effectuée au niveau du segment ; les informations d'identification personnelles spécifiées dansPiiEntityTypes sont signalées lors de la transcription complète d'un segment audio.

Vous ne pouvez pas définirContentIdentificationType etContentRedactionType dans la même demande. Si vous définissez les deux, votre demande renvoie unBadRequestException.

Pour plus d'informations, voir Suppression ou identification d'informations personnelles identifiables.

Valeurs valides : PII

ContentRedactionType

Supprime toutes les données d'identification personnelle (PII) identifiées sur votre relevé de notes.

La rédaction du contenu est effectuée au niveau du segment ; les informations personnelles spécifiées dansPiiEntityTypes sont supprimées lors de la transcription complète d'un segment audio.

Vous ne pouvez pas définirContentRedactionType etContentIdentificationType dans la même demande. Si vous définissez les deux, votre demande renvoie unBadRequestException.

Pour plus d'informations, voir Suppression ou identification d'informations personnelles identifiables.

Valeurs valides : PII

EnableChannelIdentification

Permet l'identification des canaux audio multicanaux.

L'identification des canaux transcrit le son sur chaque canal indépendamment, puis ajoute la sortie de chaque canal dans une seule transcription.

Si vous utilisez un son multicanal et que vous n'activez pas l'identification des canaux, votre audio est transcrit de manière continue et votre transcription n'est pas séparée par canal.

Si vous incluezEnableChannelIdentification dans votre demande, vous devez également inclureNumberOfChannels.

Pour de plus amples informations, veuillez consulter Transcription de l'audio multicanal.

EnablePartialResultsStabilization

Permet une stabilisation partielle des résultats de votre transcription. La stabilisation partielle des résultats peut réduire la latence de votre sortie, mais peut avoir un impact sur la précision. Pour plus d'informations, voir Stabilisation des résultats partiels.

IdentifyLanguage

Permet l'identification automatique de la langue pour votre transcription.

Si vous incluezIdentifyLanguage, vous pouvez éventuellement inclure une liste de codes de langue, en utilisantLanguageOptions, qui, selon vous, peuvent être présents dans votre flux audio. L'inclusion d'options linguistiques peut améliorer la précision de la transcription.

Vous pouvez également inclure une langue de votre choix à l'aide dePreferredLanguage. L'ajout d'une langue préférée peut aider Amazon Transcribe à identifier la langue plus rapidement que si vous omettiez ce paramètre.

Si vous avez un son multicanal qui contient différentes langues sur chaque canal et que vous avez activé l'identification des canaux, l'identification automatique de la langue identifie la langue dominante sur chaque canal audio.

Notez que vous devez inclure l'unLanguageCode ouIdentifyLanguage l'autre dans votre demande. Si vous incluez les deux paramètres, votre demande échoue.

L'identification de la langue de streaming ne peut pas être combinée à des modèles linguistiques personnalisés ou à une rédaction.

LanguageCode

Spécifiez le code de langue qui représente la langue parlée dans votre fichier audio.

Si vous n'êtes pas sûr de la langue parlée dans votre fichier audio, pensezIdentifyLanguage à l'utiliser pour activer l'identification automatique de la langue.

Pour obtenir la liste des langues prises en charge par Amazon Transcribe en streaming, consultez le tableau des langues prises en charge.

LanguageModelName

Spécifiez le nom du modèle de langue personnalisé que vous voulez utiliser lors du traitement de votre transcription. Notez que les noms des modèles de langue sont sensibles à la casse.

La langue du modèle linguistique spécifié doit correspondre au code de langue que vous spécifiez dans votre demande de transcription. Si les langues ne correspondent pas, le modèle de langue personnalisé n'est pas appliqué. Aucune erreur ou avertissement n'est associé à une incompatibilité linguistique.

Pour de plus amples informations, veuillez consulter Modèles de langue personnalisés.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

LanguageOptions

Spécifiez au moins deux codes de langue qui représentent les langues qui, selon vous, peuvent être présentes dans vos médias ; il n'est pas recommandé d'en inclure plus de cinq. Si vous ne savez pas quelles langues sont présentes, n'incluez pas ce paramètre.

L'inclusion d'options linguistiques peut améliorer la précision de l'identification de la langue.

Si vous incluezLanguageOptions dans votre demande, vous devez également inclureIdentifyLanguage.

Pour obtenir la liste des langues prises en charge par Amazon Transcribe en streaming, consultez le tableau des langues prises en charge.

Important

Vous ne pouvez inclure qu'un dialecte de langue par langue et par flux. Par exemple, vous ne pouvez pas inclureen-US eten-AU dans la même demande.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[a-zA-Z-,]+

MediaEncoding

Spécifiez l'encodage de votre entrée audio. Formats pris en charge :

FLAC
Audio codé OPUS dans un conteneur Ogg
PCM (uniquement formats audio Little-Endian 16 bits signés, qui n'incluent pas le WAV)

Pour de plus amples informations, veuillez consulter Formats de média.

Valeurs valides : pcm | ogg-opus | flac

Obligatoire : oui

MediaSampleRateHertz

Fréquence d'échantillonnage du signal audio d'entrée (en hertz). Le son de faible qualité, tel que le son du téléphone, se situe généralement autour de 8 000 Hz. Le son de haute qualité varie généralement entre 16 000 Hz et 48 000 Hz. Notez que la fréquence d'échantillonnage que vous spécifiez doit correspondre à celle de votre audio.

Plage valide : Valeur minimum de 8 000. Valeur maximum de 48 000.

Obligatoire : oui

NumberOfChannels

Spécifiez le nombre de canaux de votre flux audio. Cette valeur doit être égale à2, car seuls deux canaux sont pris en charge. Si votre audio ne contient pas plusieurs canaux, n'incluez pas ce paramètre dans votre demande.

Si vous incluezNumberOfChannels dans votre demande, vous devez également inclureEnableChannelIdentification.

Plage valide : Valeur minimum de 2.

PartialResultsStability

Spécifiez le niveau de stabilité à utiliser lorsque vous activez la stabilisation partielle des résultats (EnablePartialResultsStabilization).

Une faible stabilité fournit la plus grande précision. La haute stabilité permet de transcrire plus rapidement, mais avec une précision légèrement inférieure.

Pour plus d'informations, voir Stabilisation des résultats partiels.

Valeurs valides : high | medium | low

PiiEntityTypes

Spécifiez les types d'informations personnelles identifiables (PII) que vous souhaitez supprimer dans votre relevé de notes. Vous pouvez inclure autant de types que vous le souhaitez ou sélectionnerALL.

Pour inclurePiiEntityTypes dans votre demande, vous devez également inclure l'unContentIdentificationType ou l'autreContentRedactionType.

Les valeurs doivent être séparées par des virgules et peuvent inclure :ADDRESSBANK_ACCOUNT_NUMBERBANK_ROUTINGCREDIT_DEBIT_CVV,CREDIT_DEBIT_EXPIRY,CREDIT_DEBIT_NUMBER,EMAIL,,NAME,PHONE,PIN,SSN, ouALL.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 300.

Modèle : ^[A-Z_, ]+

PreferredLanguage

Spécifiez une langue préférée parmi le sous-ensemble de codes de langues que vous avez indiquéLanguageOptions.

Vous ne pouvez utiliser ce paramètre que si vous l'avez inclusIdentifyLanguageLanguageOptions dans votre demande.

SessionId

Spécifiez un nom pour votre session de transcription. Si vous n'incluez pas ce paramètre dans votre demande, Amazon Transcribe génère un identifiant et le renvoie dans la réponse.

Contraintes de longueur : longueur de 36.

Modèle : [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Active le partitionnement des haut-parleurs (diarisation) dans votre sortie de transcription. Le partitionnement des haut-parleurs étiquette le discours émis par chaque locuteur dans votre fichier multimédia.

Pour de plus amples informations, veuillez consulter Partitionnement des haut-parleurs (diarisation).

VocabularyFilterMethod

Spécifiez comment vous souhaitez que votre filtre de vocabulaire soit appliqué à votre relevé de notes.

Pour remplacer les mots par***, choisissezmask.

Pour supprimer des mots, choisissezremove.

Pour signaler des mots sans les modifier, choisisseztag.

Valeurs valides : remove | mask | tag

VocabularyFilterName

Spécifiez le nom du filtre de vocabulaire personnalisé que vous souhaitez utiliser lors du traitement de votre transcription. Notez que les noms des filtres de vocabulaire sont sensibles à la casse.

Si la langue du filtre de vocabulaire personnalisé spécifié ne correspond pas à la langue identifiée dans votre média, le filtre de vocabulaire n'est pas appliqué à votre transcription.

Important

Ce paramètre n'est pas destiné à être utilisé avec leIdentifyLanguage paramètre. Si vous l'incluezIdentifyLanguage dans votre demande et que vous souhaitez utiliser un ou plusieurs filtres de vocabulaire avec votre transcription, utilisez plutôt leVocabularyFilterNames paramètre.

Pour plus d'informations, voir Utilisation du filtrage du vocabulaire avec des mots indésirables.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

VocabularyFilterNames

Spécifiez les noms des filtres de vocabulaire personnalisés que vous souhaitez utiliser lors du traitement de votre transcription. Notez que les noms des filtres de vocabulaire sont sensibles à la casse.

Si aucune des langues des filtres de vocabulaire personnalisés spécifiés ne correspond à la langue identifiée dans votre média, votre tâche échoue.

Important

Ce paramètre est uniquement destiné à être utilisé avec leIdentifyLanguage paramètre. Si vous ne l'incluez pasIdentifyLanguage dans votre demande et que vous souhaitez utiliser un filtre de vocabulaire personnalisé avec votre transcription, utilisez plutôt leVocabularyFilterName paramètre.

Pour plus d'informations, voir Utilisation du filtrage du vocabulaire avec des mots indésirables.

Contraintes de longueur : Longueur minimum de 1. Longueur de 3 000.

Modèle : ^[a-zA-Z0-9,-._]+

VocabularyName

Spécifiez le nom du vocabulaire personnalisé que vous souhaitez utiliser lors du traitement de votre transcription. Notez que les noms de vocabulaire sont sensibles à la casse.

Si la langue du vocabulaire personnalisé spécifié ne correspond pas à la langue identifiée dans votre média, le vocabulaire personnalisé n'est pas appliqué à votre transcription.

Important

Ce paramètre n'est pas destiné à être utilisé avec leIdentifyLanguage paramètre. Si vous l'incluezIdentifyLanguage dans votre demande et que vous souhaitez utiliser un ou plusieurs vocabulaires personnalisés avec votre transcription, utilisez plutôt leVocabularyNames paramètre.

Pour de plus amples informations, veuillez consulter Vocabulaires personnalisés.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

VocabularyNames

Spécifiez les noms des vocabulaires personnalisés que vous souhaitez utiliser lors du traitement de votre transcription. Notez que les noms de vocabulaire sont sensibles à la casse.

Si aucune des langues des vocabulaires personnalisés spécifiés ne correspond à la langue identifiée dans votre média, votre tâche échoue.

Important

Ce paramètre est uniquement destiné à être utilisé avec leIdentifyLanguage paramètre. Si vous ne l'incluez pasIdentifyLanguage dans votre demande et que vous souhaitez utiliser un vocabulaire personnalisé avec votre transcription, utilisez plutôt leVocabularyName paramètre.

Pour de plus amples informations, veuillez consulter Vocabulaires personnalisés.

Contraintes de longueur : Longueur minimum de 1. Longueur de 3 000.

Modèle : ^[a-zA-Z0-9,-._]+

Corps de la demande

Cette demande accepte les données suivantes au format JSON.

AudioStream

Un flux codé de blobs audio. Les flux audio sont codés sous forme de HTTP/2 ou de trames de WebSocket données.

Pour de plus amples informations, veuillez consulter Transcription de l'audio en continu.

Type : objet AudioStream

Obligatoire : oui

Syntaxe de la réponse


HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName
x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization
x-amzn-transcribe-partial-results-stability: PartialResultsStability
x-amzn-transcribe-content-identification-type: ContentIdentificationType
x-amzn-transcribe-content-redaction-type: ContentRedactionType
x-amzn-transcribe-pii-entity-types: PiiEntityTypes
x-amzn-transcribe-language-model-name: LanguageModelName
x-amzn-transcribe-identify-language: IdentifyLanguage
x-amzn-transcribe-language-options: LanguageOptions
x-amzn-transcribe-preferred-language: PreferredLanguage
x-amzn-transcribe-vocabulary-names: VocabularyNames
x-amzn-transcribe-vocabulary-filter-names: VocabularyFilterNames
Content-type: application/json

{
   "TranscriptResultStream": { 
      "BadRequestException": { 
      },
      "ConflictException": { 
      },
      "InternalFailureException": { 
      },
      "LimitExceededException": { 
      },
      "ServiceUnavailableException": { 
      },
      "TranscriptEvent": { 
         "Transcript": { 
            "Results": [ 
               { 
                  "Alternatives": [ 
                     { 
                        "Entities": [ 
                           { 
                              "Category": "string",
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "StartTime": number,
                              "Type": "string"
                           }
                        ],
                        "Items": [ 
                           { 
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "Speaker": "string",
                              "Stable": boolean,
                              "StartTime": number,
                              "Type": "string",
                              "VocabularyFilterMatch": boolean
                           }
                        ],
                        "Transcript": "string"
                     }
                  ],
                  "ChannelId": "string",
                  "EndTime": number,
                  "IsPartial": boolean,
                  "LanguageCode": "string",
                  "LanguageIdentification": [ 
                     { 
                        "LanguageCode": "string",
                        "Score": number
                     }
                  ],
                  "ResultId": "string",
                  "StartTime": number
               }
            ]
         }
      }
   }
}

Eléments de réponse

Si l'action aboutit, le service renvoie une réponse HTTP 200.

La réponse renvoie les en-têtes HTTP suivants.

ContentIdentificationType

Indique si l'identification du contenu a été activée pour votre transcription.

Valeurs valides : PII

ContentRedactionType

Indique si la rédaction du contenu a été activée pour votre transcription.

Valeurs valides : PII

EnableChannelIdentification

Indique si l'identification des chaînes a été activée pour votre transcription.

EnablePartialResultsStabilization

Indique si la stabilisation partielle des résultats a été activée pour votre transcription.

IdentifyLanguage

Indique si l'identification automatique de la langue a été activée pour votre transcription.

LanguageCode

Fournit le code de langue que vous avez spécifié dans votre demande.

LanguageModelName

Fournit le nom du modèle de langue personnalisé que vous avez spécifié dans votre demande.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

LanguageOptions

Fournit les codes de langue que vous avez spécifiés dans votre demande.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[a-zA-Z-,]+

MediaEncoding

Fournit le codage multimédia que vous avez spécifié dans votre demande.

Valeurs valides : pcm | ogg-opus | flac

MediaSampleRateHertz

Fournit la fréquence d'échantillonnage que vous avez spécifiée dans votre demande.

Plage valide : Valeur minimum de 8 000. Valeur maximum de 48 000.

NumberOfChannels

Fournit le nombre de chaînes que vous avez indiqué dans votre demande.

Plage valide : Valeur minimum de 2.

PartialResultsStability

Indique le niveau de stabilisation utilisé pour votre transcription.

Valeurs valides : high | medium | low

PiiEntityTypes

Répertorie les types d'entités PII que vous avez spécifiés dans votre demande.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 300.

Modèle : ^[A-Z_, ]+

PreferredLanguage

Fournit la langue préférée que vous avez spécifiée dans votre demande.

RequestId

Fournit l'identifiant de votre demande de streaming.

SessionId

Fournit l'identifiant de votre session de transcription.

Contraintes de longueur : longueur de 36.

Modèle : [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Indique si le partitionnement des haut-parleurs a été activé pour votre transcription.

VocabularyFilterMethod

Fournit la méthode de filtrage du vocabulaire utilisée dans votre transcription.

Valeurs valides : remove | mask | tag

VocabularyFilterName

Fournit le nom du filtre de vocabulaire personnalisé que vous avez spécifié dans votre demande.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

VocabularyFilterNames

Fournit les noms des filtres de vocabulaire personnalisés que vous avez spécifiés dans votre demande.

Contraintes de longueur : Longueur minimum de 1. Longueur de 3 000.

Modèle : ^[a-zA-Z0-9,-._]+

VocabularyName

Fournit le nom du vocabulaire personnalisé que vous avez spécifié dans votre demande.

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

VocabularyNames

Fournit les noms des vocabulaires personnalisés que vous avez spécifiés dans votre demande.

Contraintes de longueur : Longueur minimum de 1. Longueur de 3 000.

Modèle : ^[a-zA-Z0-9,-._]+

Les données suivantes sont renvoyées au format JSON par le service.

TranscriptResultStream

Fournit des informations détaillées sur votre session de streaming.

Type : objet TranscriptResultStream

Erreurs

Pour plus d'informations sur les erreurs communes à toutes les actions, reportez-vous à la sectionErreurs courantes.

BadRequestException

Un ou plusieurs arguments en faveur de l'StartCallAnalyticsStreamTranscriptionopérationStartStreamTranscriptionStartMedicalStreamTranscription, ou n'étaient pas valides. Par exemple,MediaEncoding ou vous avezLanguageCode utilisé des valeurs non prises en charge. Vérifiez les paramètres spécifiés et réessayez votre demande.

Code d'état HTTP : 400

ConflictException

Un nouveau flux a commencé avec le même identifiant de session. Le flux actuel a été interrompu.

Code d'état HTTP : 409

InternalFailureException

Un problème est survenu lors du traitement de l'audio. Amazon Transcribe a mis fin au traitement.

Code d'état HTTP : 500

LimitExceededException

Votre client a dépassé l'une des limites d'Amazon Transcribe. Il s'agit généralement de la limite de longueur audio. Divisez votre flux audio en petits morceaux et réessayez votre demande.

Code d'état HTTP : 429

ServiceUnavailableException

Le service n'est pas disponible actuellement. Réessayez votre demande plus tard.

HTTP Status Code: 503

Voir aussi

Pour plus d'informations sur l'utilisation de cette API dans l'un des kits SDK AWS spécifiques au langage, consultez les ressources suivantes :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

StartMedicalStreamTranscription

Types de données