Utilizzo di un vocabolario personalizzato in una trascrizione in batch Utilizzo di un vocabolario personalizzato in una trascrizione in streaming

Utilizzo di un vocabolario personalizzato

Una volta creato il vocabolario personalizzato, puoi includerlo nelle tue richieste di trascrizione; consulta le sezioni seguenti per alcuni esempi.

La lingua del vocabolario personalizzato da includere nella richiesta deve corrispondere al codice della lingua specificato per i file multimediali. Se le lingue non corrispondono, il vocabolario personalizzato non viene applicato alla trascrizione e non vengono visualizzati avvisi o errori.

Utilizzo di un vocabolario personalizzato in una trascrizione in batch

Per utilizzare un vocabolario personalizzato con una trascrizione in batch, vedi quanto segue per alcuni esempi:

Accedi alla AWS Management Console.
Nel riquadro di navigazione, scegli Processi di trascrizione, quindi seleziona Crea processo (in alto a destra). Si aprirà la pagina Specifica i dettagli del processo.

Assegna un nome al tuo processo e specifica i file multimediali di input. Facoltativamente, includi qualsiasi altro campo, quindi scegli Avanti.
Nella parte inferiore della pagina Configura processo, nel pannello Personalizzazione, attiva Vocabolario personalizzato.
Seleziona il vocabolario personalizzato dal menu a tendina.

Seleziona Crea processo per eseguire il processo di trascrizione.

Questo esempio utilizza il start-transcription-jobcomando e il Settings parametro con il sottoparametro. VocabularyName Per ulteriori informazioni, consulta StartTranscriptionJob e Settings.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings VocabularyName=my-first-vocabulary

Ecco un altro esempio di utilizzo del start-transcription-jobcomando e un corpo della richiesta che include il vocabolario personalizzato in quel processo.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-vocabulary-job.json

Il file my-first-vocabulary-job.json contiene il seguente corpo della richiesta.


{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "VocabularyName": "my-first-vocabulary"
   }
}

Questo esempio utilizza AWS SDK per Python (Boto3) per includere un vocabolario personalizzato utilizzando l'Settingsargomento per il metodo start_transcription_job. Per ulteriori informazioni, consulta StartTranscriptionJob e Settings.

Per ulteriori esempi di utilizzo dello scenario e degli esempi interservizi AWS SDKs, inclusi quelli relativi a specifiche funzionalità, consultate il capitolo. Esempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'VocabularyName': 'my-first-vocabulary' 
   }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Utilizzo di un vocabolario personalizzato in una trascrizione in streaming

Per utilizzare un vocabolario personalizzato con una trascrizione in streaming, vedi quanto segue per alcuni esempi:

Accedi alla AWS Management Console.
Nel riquadro di navigazione scegli Trascrizione in tempo reale. Scorri verso il basso fino a Personalizzazioni ed espandi questo campo se è ridotto al minimo.
Attiva Vocabolario personalizzato e seleziona un vocabolario personalizzato dal menu a discesa.

Includi tutte le altre impostazioni che desideri applicare al flusso.
A questo punto puoi eseguire la trascrizione del flusso. Seleziona Avvia streaming e inizia a parlare. Per terminare la dettatura, seleziona Interrompi streaming.

Questo esempio crea una richiesta HTTP/2 che include il vocabolario personalizzato. Per ulteriori informazioni sull'utilizzo dello streaming HTTP/2 con, consulta. Amazon TranscribeImpostazione di un flusso HTTP/2 Per ulteriori dettagli sui parametri e le intestazioni specifici di Amazon Transcribe, consulta StartStreamTranscription.


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-vocabulary-name: my-first-vocabulary
transfer-encoding: chunked

Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioni AWS API sono elencati nella sezione Parametri comuni.

Questo esempio crea un URL predefinito che applica il tuo vocabolario personalizzato a uno stream. WebSocket Le interruzioni di riga sono state aggiunte per la leggibilità. Per ulteriori informazioni sull'utilizzo degli WebSocket stream con, consulta. Amazon TranscribeConfigurazione di uno WebSocket stream Per ulteriori dettagli sui parametri, consulta StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&vocabulary-name=my-first-vocabulary

Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioni AWS API sono elencati nella sezione Parametri comuni.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Creazione di un vocabolario personalizzato tramite un elenco

Modelli linguistici personalizzati