Utilizzo di un modello linguistico personalizzato - Amazon Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di un modello linguistico personalizzato

Dopo aver creato il modello linguistico personalizzato, puoi includerlo nelle tue richieste di trascrizione; consulta le sezioni seguenti per alcuni esempi.

La lingua del modello da includere nella richiesta deve corrispondere al codice della lingua specificato per i file multimediali. Se le lingue non corrispondono, il modello linguistico personalizzato non viene applicato alla trascrizione e non vengono visualizzati avvisi o errori.

Utilizzo di un modello linguistico personalizzato in una trascrizione in batch

Per utilizzare un modello linguistico personalizzato con una trascrizione in batch, vedi quanto segue per alcuni esempi:

  1. Accedi alla AWS Management Console.

  2. Nel riquadro di navigazione, scegli Processi di trascrizione, quindi seleziona Crea processo (in alto a destra). Si aprirà la pagina Specifica i dettagli del processo.

  3. Nel pannello Impostazioni processo, in Tipo di modello, seleziona la casella Modello linguistico personalizzato.

    Amazon Transcribe screenshot della console: la pagina «impostazioni del lavoro».

    È inoltre necessario selezionare una lingua di input dal menu a discesa.

    Amazon Transcribe schermata della console: la pagina «impostazioni del lavoro» che mostra il menu a discesa della lingua.
  4. In Selezione del modello personalizzato, seleziona un modello linguistico personalizzato esistente dal menu a discesa o creane uno nuovo.

    Aggiungi la Amazon S3 posizione del file di input nel pannello Dati di input.

  5. Seleziona Avanti per opzioni di configurazione aggiuntive.

    Seleziona Crea processo per eseguire il processo di trascrizione.

Questo esempio utilizza il start-transcription-jobcomando e il ModelSettings parametro con il VocabularyName sottoparametro. Per ulteriori informazioni, consulta StartTranscriptionJob e ModelSettings.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \ --output-bucket-name amzn-s3-demo-bucket \ --output-key my-output-files/ \ --language-code en-US \ --model-settings LanguageModelName=my-first-language-model

Ecco un altro esempio di utilizzo del start-transcription-jobcomando e un corpo della richiesta che include il modello di linguaggio personalizzato in quel processo.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://my-first-model-job.json

Il file my-first-model-job.json contiene il seguente corpo della richiesta.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "ModelSettings": { "LanguageModelName": "my-first-language-model" } }

Questo esempio utilizza AWS SDK per Python (Boto3) per includere un modello di linguaggio personalizzato utilizzando l'ModelSettingsargomento per il metodo start_transcription_job. Per ulteriori informazioni, consulta StartTranscriptionJob e ModelSettings.

Per ulteriori esempi di utilizzo dello scenario e degli esempi tra servizi AWS SDKs, inclusi quelli relativi a specifiche funzionalità, consultate il capitolo. Esempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', ModelSettings = { 'LanguageModelName': 'my-first-language-model' } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Utilizzo di un modello linguistico personalizzato in una trascrizione in streaming

Per utilizzare un modello linguistico personalizzato con una trascrizione in streaming, consulta quanto segue per alcuni esempi:

  1. Accedi alla AWS Management Console.

  2. Nel riquadro di navigazione scegli Trascrizione in tempo reale. Scorri verso il basso fino a Personalizzazioni ed espandi questo campo se è ridotto al minimo.

    Amazon Transcribe screenshot della console: la pagina di «trascrizione in tempo reale».
  3. Attiva Modello linguistico personalizzato e seleziona un modello dal menu a discesa.

    Amazon Transcribe schermata della console: il pannello «personalizzazioni» ampliato.

    Includi tutte le altre impostazioni che desideri applicare allo flusso.

  4. A questo punto puoi eseguire la trascrizione del flusso. Seleziona Avvia streaming e inizia a parlare. Per terminare la dettatura, seleziona Interrompi streaming.

Questo esempio crea una richiesta HTTP/2 che include il modello linguistico personalizzato. Per ulteriori informazioni sull'utilizzo dello streaming HTTP/2 con, consulta. Amazon TranscribeImpostazione di un flusso HTTP/2 Per ulteriori dettagli sui parametri e sulle intestazioni specifici di, consulta. Amazon TranscribeStartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-language-model-name: my-first-language-model transfer-encoding: chunked

Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioni AWS API sono elencati nella sezione Parametri comuni.

Questo esempio crea un URL predefinito che applica il modello linguistico personalizzato a uno WebSocket stream. Le interruzioni di riga sono state aggiunte per la leggibilità. Per ulteriori informazioni sull'utilizzo degli WebSocket stream con Amazon Transcribe, consulta. Configurazione di uno WebSocket stream Per ulteriori dettagli sui parametri, consulta StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &language-model-name=my-first-language-model

Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioni AWS API sono elencati nella sezione Parametri comuni.