Utilisation d’un modèle de langue personnalisé dans une transcription par lots Utilisation d’un modèle de langue personnalisé dans une transcription en streaming

Utilisation d’un modèle de langue personnalisé

Une fois que vous avez créé votre modèle de langue personnalisé, vous pouvez l’inclure dans vos demandes de transcription. Consultez les sections suivantes pour des exemples.

La langue du modèle que vous incluez dans votre demande doit correspondre au code de langue que vous spécifiez pour votre fichier multimédia. Si les langues ne correspondent pas, votre modèle de langue personnalisé n’est pas appliqué à votre transcription et il n’y a aucun avertissement ni erreur.

Utilisation d’un modèle de langue personnalisé dans une transcription par lots

Pour utiliser un modèle de langue personnalisé avec une transcription par lots, consultez les exemples suivants :

Connectez-vous à la AWS Management Console.
Dans le volet de navigation, choisissez Tâches de transcription, puis sélectionnez Créer une tâche (en haut à droite). La page Spécifier les détails de la tâche s’ouvre.
Dans le volet Paramètres de la tâche, sous Type de modèle, sélectionnez la case Modèle de langue personnalisé.

Vous devez également sélectionner une langue d’entrée dans le menu déroulant.
Sous Sélection du modèle personnalisé, sélectionnez un modèle de langue personnalisé existant dans le menu déroulant ou Créer nouveau.

Ajoutez l' Amazon S3 emplacement de votre fichier d'entrée dans le panneau Données d'entrée.
Sélectionnez Suivant pour accéder à des options de configuration supplémentaires.

Sélectionnez Créer une tâche pour exécuter votre tâche de transcription.

Cet exemple utilise la start-transcription-jobcommande et le ModelSettings paramètre avec le VocabularyName sous-paramètre. Pour plus d’informations, consultez StartTranscriptionJob et ModelSettings.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--model-settings LanguageModelName=my-first-language-model

Voici un autre exemple d'utilisation de la start-transcription-jobcommande et d'un corps de requête qui inclut votre modèle de langage personnalisé avec cette tâche.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-model-job.json

Le fichier my-first-model-job.json contient le corps de requête suivant.


{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "ModelSettings": {
        "LanguageModelName": "my-first-language-model"
   }
}

Cet exemple utilise le AWS SDK pour Python (Boto3) pour inclure un modèle de langage personnalisé utilisant l'ModelSettingsargument de la méthode start_transcription_job. Pour plus d’informations, consultez StartTranscriptionJob et ModelSettings.

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    ModelSettings = {
        'LanguageModelName': 'my-first-language-model' 
   }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Utilisation d’un modèle de langue personnalisé dans une transcription en streaming

Pour utiliser un modèle de langue personnalisé avec une transcription en streaming, consultez les exemples suivants :

Connectez-vous au AWS Management Console.
Dans le panneau de navigation, choisissez Transcription en temps réel. Faites défiler jusqu’à Personnalisations et développez ce champ s’il est réduit.
Activez Modèle de langue personnalisé et sélectionnez un modèle dans le menu déroulant.

Incluez les autres paramètres que vous souhaitez appliquer à votre flux.
Vous êtes prêt à transcrire votre flux. Sélectionnez Démarrer le streaming et commencez à parler. Pour mettre fin à votre dictée, sélectionnez Arrêter le streaming.

Cet exemple crée une requête HTTP/2 qui inclut votre modèle de langue personnalisé. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avec Amazon Transcribe, consultezConfiguration d’un flux HTTP/2. Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, voir StartStreamTranscription.


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-language-model-name: my-first-language-model
transfer-encoding: chunked

Les définitions des paramètres se trouvent dans la référence d'API ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section Paramètres communs.

Cet exemple crée une URL présignée qui applique votre modèle de langage personnalisé à un WebSocket flux. Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultezConfiguration d'un WebSocket stream. Pour plus de détails sur les paramètres, consultez la section StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&language-model-name=my-first-language-model

Les définitions des paramètres se trouvent dans la référence d'API ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section Paramètres communs.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Création d’un modèle de langue personnalisé

Filtrage des mots