StartTranscriptionJob - Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

StartTranscriptionJob

Trascrive l'audio da un file multimediale e applica eventuali parametri di richiesta aggiuntivi che scegli di includere nella richiesta.

Per effettuare unaStartTranscriptionJob richiesta, devi prima caricare il tuo file multimediale in un bucket Amazon S3; puoi quindi specificare la posizione Amazon S3 del file utilizzando ilMedia parametro.

È necessario includere i seguenti parametri nellaStartTranscriptionJob richiesta:

  • region: IlRegione AWS luogo in cui stai facendo la tua richiesta. Per un elenco dei dispositiviRegioni AWS supportati con Amazon Transcribe, consulta gli endpoint e le quote di Amazon Transcribe.

  • TranscriptionJobName: un nome personalizzato che crei per il tuo lavoro di trascrizione e che sia unico all'interno del tuoAccount AWS.

  • Media(MediaFileUri): la posizione Amazon S3 del tuo file multimediale.

  • Uno deiLanguageCodeIdentifyLanguage, oIdentifyMultipleLanguages: Se conosci la lingua del tuo file multimediale, specificala utilizzando ilLanguageCode parametro; puoi trovare tutti i codici di lingua validi nella tabella Lingue supportate. Se non conosci le lingue parlate nei tuoi media, usane unaIdentifyLanguage oIdentifyMultipleLanguages lascia che Amazon Transcribe identifichi le lingue per te.

Sintassi della richiesta

{ "ContentRedaction": { "PiiEntityTypes": [ "string" ], "RedactionOutput": "string", "RedactionType": "string" }, "IdentifyLanguage": boolean, "IdentifyMultipleLanguages": boolean, "JobExecutionSettings": { "AllowDeferredExecution": boolean, "DataAccessRoleArn": "string" }, "KMSEncryptionContext": { "string" : "string" }, "LanguageCode": "string", "LanguageIdSettings": { "string" : { "LanguageModelName": "string", "VocabularyFilterName": "string", "VocabularyName": "string" } }, "LanguageOptions": [ "string" ], "Media": { "MediaFileUri": "string", "RedactedMediaFileUri": "string" }, "MediaFormat": "string", "MediaSampleRateHertz": number, "ModelSettings": { "LanguageModelName": "string" }, "OutputBucketName": "string", "OutputEncryptionKMSKeyId": "string", "OutputKey": "string", "Settings": { "ChannelIdentification": boolean, "MaxAlternatives": number, "MaxSpeakerLabels": number, "ShowAlternatives": boolean, "ShowSpeakerLabels": boolean, "VocabularyFilterMethod": "string", "VocabularyFilterName": "string", "VocabularyName": "string" }, "Subtitles": { "Formats": [ "string" ], "OutputStartIndex": number }, "Tags": [ { "Key": "string", "Value": "string" } ], "TranscriptionJobName": "string" }

Parametri della richiesta

Per informazioni sui parametri comuni a tutte le azioni, vedere Parametri comuni.

La richiesta accetta i seguenti dati in formato JSON.

ContentRedaction

Consente di eliminare o contrassegnare le informazioni di identificazione personale (PII) specificate nella trascrizione. Se si utilizzaContentRedaction, è necessario includere anche i sottoparametri:PiiEntityTypesRedactionOutput, eRedactionType.

Tipo: ContentRedaction oggetto

Required: No

IdentifyLanguage

Abilita l'identificazione automatica della lingua nella richiesta di lavoro di trascrizione. Utilizzate questo parametro se il file multimediale contiene una sola lingua. Se i tuoi file multimediali contengono più lingue, usaliIdentifyMultipleLanguages invece.

Se lo includiIdentifyLanguage, puoi facoltativamente includere un elenco di codici di lingua, utilizzandoLanguageOptions, che ritieni possano essere presenti nel tuo file multimediale. Sono incluseLanguageOptions limitazioni soloIdentifyLanguage alle opzioni linguistiche specificate, che possono migliorare la precisione della trascrizione.

Se desideri applicare un modello linguistico personalizzato, un vocabolario personalizzato o un filtro di vocabolario personalizzato alla tua richiesta di identificazione automatica della lingua, includiLanguageIdSettings i relativi sottoparametri (VocabularyNameLanguageModelName, eVocabularyFilterName). Se includiLanguageIdSettings, includi ancheLanguageOptions.

Tieni presente che devi includere uno deiLanguageCodeIdentifyLanguage, oIdentifyMultipleLanguages nella tua richiesta. Se includi più di uno di questi parametri, il processo di trascrizione fallisce.

Tipo: Booleano

Required: No

IdentifyMultipleLanguages

Consente l'identificazione automatica multilingue nella richiesta di lavoro di trascrizione. Utilizzate questo parametro se il file multimediale contiene più di una lingua. Se i tuoi file multimediali contengono una sola lingua, usaliIdentifyLanguage invece.

Se lo includiIdentifyMultipleLanguages, puoi facoltativamente includere un elenco di codici di lingua, utilizzandoLanguageOptions, che ritieni possano essere presenti nel tuo file multimediale. Sono incluseLanguageOptions limitazioni soloIdentifyLanguage alle opzioni linguistiche specificate, che possono migliorare la precisione della trascrizione.

Se desideri applicare un vocabolario personalizzato o un filtro di vocabolario personalizzato alla tua richiesta di identificazione automatica della lingua, includiLanguageIdSettings i relativi sottoparametri (VocabularyNameeVocabularyFilterName). Se includiLanguageIdSettings, includi ancheLanguageOptions.

Tieni presente che devi includere uno deiLanguageCodeIdentifyLanguage, oIdentifyMultipleLanguages nella tua richiesta. Se includi più di uno di questi parametri, il processo di trascrizione fallisce.

Tipo: Booleano

Required: No

JobExecutionSettings

Consente di controllare il modo in cui viene elaborato il lavoro di trascrizione. Attualmente, l'unicaJobExecutionSettings modifica che puoi scegliere è abilitare l'accodamento dei lavori utilizzando ilAllowDeferredExecution sottoparametro.

Se includiJobExecutionSettings nella tua richiesta, devi includere anche i sottoparametri:AllowDeferredExecution eDataAccessRoleArn.

Tipo: JobExecutionSettings oggetto

Required: No

KMSEncryptionContext

Una mappa di coppie chiave/valore in testo normale e non segrete, note come coppie di contesto di crittografia, che forniscono un ulteriore livello di sicurezza per i tuoi dati. Per ulteriori informazioni, vedere Contesto diAWS KMS crittografia e Chiavi asimmetriche inAWS KMS.

Tipo: mappatura stringa a stringa

Voci di mappatura: numero massimo di 10 elementi.

Limitazioni di lunghezza della chiave: la lunghezza minima è 1. La lunghezza massima è 2000 caratteri.

Modello di chiave:.*\S.*

Valore dei vincoli di lunghezza: lunghezza minima di 1. La lunghezza massima è 2000 caratteri.

Modello di valore:.*\S.*

Required: No

LanguageCode

Il codice della lingua che rappresenta la lingua parlata nel file multimediale di input.

Se non sei sicuro della lingua parlata nel tuo file multimediale, valuta la possibilità di utilizzareIdentifyLanguage oIdentifyMultipleLanguages abilitare l'identificazione automatica della lingua.

Tieni presente che devi includere uno deiLanguageCodeIdentifyLanguage, oIdentifyMultipleLanguages nella tua richiesta. Se includi più di uno di questi parametri, il processo di trascrizione fallisce.

Per un elenco delle lingue supportate e dei codici di lingua associati, consulta la tabella Lingue supportate.

Nota

Per trascrivere il parlato in arabo standard moderno (ar-SA), il file multimediale deve essere codificato con una frequenza di campionamento di 16.000 Hz o superiore.

Tipo: String

Valori validi: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Required: No

LanguageIdSettings

Se utilizzi l'identificazione automatica della lingua nella tua richiesta e desideri applicare un modello linguistico personalizzato, un vocabolario personalizzato o un filtro di vocabolario personalizzato,LanguageIdSettings includi i sottoparametri pertinenti (VocabularyNameLanguageModelName, eVocabularyFilterName). Tieni presente che l'identificazione multilingue (IdentifyMultipleLanguages) non supporta modelli linguistici personalizzati.

LanguageIdSettingssupporta da due a cinque codici linguistici. A ogni codice linguistico che includi può essere associato un modello linguistico personalizzato, un vocabolario personalizzato e un filtro di vocabolario personalizzato. I codici di lingua specificati devono corrispondere alle lingue dei modelli linguistici personalizzati associati, dei vocabolari personalizzati e dei filtri di vocabolario personalizzati.

Si consiglia di includerloLanguageOptions durante l'utilizzoLanguageIdSettings per garantire che venga identificato il dialetto linguistico corretto. Ad esempio, se specifichi un vocabolario personalizzato in usoen-US ma Amazon Transcribe determina che la lingua parlata nei tuoi file multimediali è la stessaen-AU, il vocabolario personalizzato non viene applicato alla trascrizione. Se includiLanguageOptions e includien-US come unico dialetto in lingua inglese, il tuo vocabolario personalizzato viene applicato alla trascrizione.

Se desideri includere un modello linguistico personalizzato nella tua richiesta ma non desideri utilizzare l'identificazione automatica della lingua, utilizza invece il ModelSettings parametro con ilLanguageModelName sottoparametro. Se desideri includere un vocabolario personalizzato o un filtro di vocabolario personalizzato (o entrambi) nella tua richiesta ma non desideri utilizzare l'identificazione automatica della lingua, utilizza invece il Settings parametro con il sottoparametroVocabularyName orVocabularyFilterName (o entrambi).

Tipo: mappatura da stringa aLanguageIdSettings oggetto

Voci di mappatura: numero massimo di 5 elementi.

Chiavi valide: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Required: No

LanguageOptions

È possibile specificare due o più codici di lingua che rappresentano le lingue che si ritiene possano essere presenti nei file multimediali. Non è consigliabile includerne più di cinque. Se non sei sicuro delle lingue presenti, non includere questo parametro.

Se includiLanguageOptions nella richiesta, devi includere ancheIdentifyLanguage.

Per ulteriori informazioni, consulta Lingue supportate.

Per trascrivere il parlato in arabo standard moderno (ar-SA), il file multimediale deve essere codificato con una frequenza di campionamento di 16.000 Hz o superiore.

Tipo: matrice di stringhe

Membri dell’array: numero minimo di 1 elemento.

Valori validi: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Required: No

Media

Descrive la posizione Amazon S3 del file multimediale che desideri utilizzare nella richiesta.

Tipo: Media oggetto

Campo obbligatorio: sì

MediaFormat

Specifica il formato del file multimediale di input.

Tipo: String

Valori validi: mp3 | mp4 | wav | flac | ogg | amr | webm

Required: No

MediaSampleRateHertz

La frequenza di campionamento, in hertz, della traccia audio nel file multimediale di ingresso.

Se non specifichi la frequenza di campionamento dei file multimediali, Amazon Transcribe la determina automaticamente. Se si specifica la frequenza di campionamento, questa deve corrispondere a quella rilevata da Amazon Transcribe. Se c'è una mancata corrispondenza tra il valore specificato e il valore rilevato, il processo ha esito negativo. Nella maggior parte dei casi, puoi omettereMediaSampleRateHertz e lasciare che Amazon Transcribe determini la frequenza di campionamento.

Tipo: integer

Intervallo valido: valore minimo pari a 8000. Valore massimo pari a.

Required: No

ModelSettings

Specifica il modello linguistico personalizzato che desideri includere nel tuo lavoro di trascrizione. Se includiModelSettings nella tua richiesta, devi includere ilLanguageModelName sottoparametro.

Per ulteriori informazioni, consulta Modelli linguistici personalizzati.

Tipo: ModelSettings oggetto

Required: No

OutputBucketName

Il nome del bucket Amazon S3 in cui desideri archiviare l'output di trascrizione. Non includere ilS3:// prefisso del bucket specificato.

Se vuoi che il tuo output vada in una sottocartella di questo bucket, specificalo usando ilOutputKey parametro; accettaOutputBucketName solo il nome di un bucket.

Ad esempio, se desideri che l'output venga archiviato inS3://DOC-EXAMPLE-BUCKET, impostaOutputBucketName suDOC-EXAMPLE-BUCKET. Tuttavia, se desideri che l'output venga archiviato inS3://DOC-EXAMPLE-BUCKET/test-files/, impostaOutputBucketName suDOC-EXAMPLE-BUCKET eOutputKey sutest-files/.

Tieni presente che Amazon Transcribe deve avere l'autorizzazione per utilizzare la posizione specificata. Puoi modificare le autorizzazioni di Amazon S3 utilizzando il AWS Management Console. Vedi anche Autorizzazioni richieste per i ruoli utente IAM.

Se non lo specifichiOutputBucketName, la trascrizione viene inserita in un bucket Amazon S3 gestito dal servizio e ti viene fornito un URI per accedere alla trascrizione.

Tipo: String

Limitazioni di lunghezza: lunghezza massima di 64.

Modello: [a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]

Required: No

OutputEncryptionKMSKeyId

Chiave KMS che desideri utilizzare per crittografare l'output della trascrizione.

Se usi una chiave che si trova nella correnteAccount AWS, puoi specificare la tua chiave KMS in quattro modi:

  1. Usa l'ID della chiave KMS stesso. Ad esempio, 1234abcd-12ab-34cd-56ef-1234567890ab.

  2. Utilizza un alias per l'ID della chiave KMS. Ad esempio, alias/ExampleAlias.

  3. Utilizza l'Amazon Resource Name (ARN) per l'ID della chiave KMS. Ad esempio, arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab.

  4. Utilizza l'ARN per l'alias della chiave KMS. Ad esempio, arn:aws:kms:region:account-ID:alias/ExampleAlias.

Se usi una chiave che si trova in una posizione Account AWSdiversa da quella attualeAccount AWS, puoi specificare la tua chiave KMS in due modi:

  1. Usa l'ARN per l'ID della chiave KMS. Ad esempio, arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab.

  2. Utilizza l'ARN per l'alias della chiave KMS. Ad esempio, arn:aws:kms:region:account-ID:alias/ExampleAlias.

Se non specifichi una chiave di crittografia, l'output viene crittografato con la chiave Amazon S3 (SSE-S3) (SSE-S3) di default (SSE-S3).

Se si specifica una chiave KMS per crittografare l'output, è necessario specificare anche una posizione di output utilizzando ilOutputLocation parametro.

Si noti che il ruolo che effettua laStartCallAnalyticsJob richiesta deve avere l'autorizzazione per utilizzare la chiave KMS specificata.

Tipo: String

Limitazioni di lunghezza: lunghezza minima di 1. La lunghezza massima è 2048 caratteri.

Modello: ^[A-Za-z0-9][A-Za-z0-9:_/+=,@.-]{0,2048}$

Required: No

OutputKey

Utilizzalo in combinazione conOutputBucketName per specificare la posizione di output della trascrizione e, facoltativamente, un nome univoco per il file di output. Il nome predefinito per l'output della trascrizione è lo stesso che hai specificato per il lavoro di trascrizione (TranscriptionJobName).

Di seguito sono elencati alcuni esempi di come utilizzareOutputKey:

  • Se si specifica 'DOC-EXAMPLE-BUCKET' comeOutputBucketName e 'my-transcript.json' comeOutputKey, il percorso di output della trascrizione ès3://DOC-EXAMPLE-BUCKET/my-transcript.json.

  • Se specifichi 'my-first-transcription' comeTranscriptionJobName, 'DOC-EXAMPLE-BUCKET' come e 'my-transcript' comeOutputKey, il percorso di output della trascrizione ès3://DOC-EXAMPLE-BUCKET/my-transcript/my-first-transcription.json.OutputBucketName

  • Se si specifica 'DOC-EXAMPLE-BUCKET' comeOutputBucketName e 'test-files/my-transcript.json' comeOutputKey, il percorso di output della trascrizione ès3://DOC-EXAMPLE-BUCKET/test-files/my-transcript.json.

  • Se specifichi 'my-first-transcription' comeTranscriptionJobName, 'DOC-EXAMPLE-BUCKET' come e 'test-files/my-transcript' come percorso di output dellaOutputKey trascrizione ès3://DOC-EXAMPLE-BUCKET/test-files/my-transcript/my-first-transcription.json.OutputBucketName

Se specifichi il nome di una sottocartella del bucket Amazon S3 che non esiste, ne viene creata una automaticamente.

Tipo: String

Limitazioni di lunghezza: lunghezza minima di 1. La lunghezza massima è 1024 caratteri.

Modello: [a-zA-Z0-9-_.!*'()/]{1,1024}$

Required: No

Settings

Specifica impostazioni opzionali aggiuntive nellaStartTranscriptionJob richiesta, tra cui l'identificazione del canale, le trascrizioni alternative, il partizionamento dei diffusori. Puoi usarlo per applicare vocabolari personalizzati e filtri di vocabolario.

Se desideri includere un vocabolario personalizzato o un filtro di vocabolario personalizzato (o entrambi) nella tua richiesta ma non desideri utilizzare l'identificazione automatica della lingua, usaloSettings con il sottoparametroVocabularyName orVocabularyFilterName (o entrambi).

Se utilizzi l'identificazione automatica della lingua nella tua richiesta e desideri includere un modello linguistico personalizzato, un vocabolario personalizzato o un filtro di vocabolario personalizzato, utilizza invece il LanguageIdSettings parametro conVocabularyFilterName i sottoparametriVocabularyName o.LanguageModelName

Tipo: Settings oggetto

Required: No

Subtitles

Produce file di sottotitoli per i file multimediali di input. È possibile specificare i formati WebVTT (*.vtt) e SubRip (*.srt).

Tipo: Subtitles oggetto

Required: No

Tags

Aggiunge uno o più tag personalizzati, ciascuno sotto forma di coppia chiave:valore, a un nuovo processo di trascrizione nel momento in cui inizi questo nuovo lavoro.

Per ulteriori informazioni sull'uso dei tag con Amazon Transcribe, consulta Risorse di tagging.

Tipo: matrice di oggetti Tag

Membri dell’array: numero minimo di 1 elemento. Numero massimo di elementi.

Required: No

TranscriptionJobName

Un nome univoco, scelto da te, per il tuo lavoro di trascrizione. Il nome specificato viene utilizzato anche come nome predefinito del file di output della trascrizione. Se desideri specificare un nome diverso per l'output della trascrizione, usa ilOutputKey parametro.

Questo nome fa distinzione tra maiuscole e minuscole, non può contenere spazi e deve essere univoco all'interno di unAccount AWS. Se si tenta di creare un nuovo lavoro con lo stesso nome di un lavoro esistente, viene visualizzato unConflictException errore.

Tipo: String

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

Campo obbligatorio: sì

Sintassi della risposta

{ "TranscriptionJob": { "CompletionTime": number, "ContentRedaction": { "PiiEntityTypes": [ "string" ], "RedactionOutput": "string", "RedactionType": "string" }, "CreationTime": number, "FailureReason": "string", "IdentifiedLanguageScore": number, "IdentifyLanguage": boolean, "IdentifyMultipleLanguages": boolean, "JobExecutionSettings": { "AllowDeferredExecution": boolean, "DataAccessRoleArn": "string" }, "LanguageCode": "string", "LanguageCodes": [ { "DurationInSeconds": number, "LanguageCode": "string" } ], "LanguageIdSettings": { "string" : { "LanguageModelName": "string", "VocabularyFilterName": "string", "VocabularyName": "string" } }, "LanguageOptions": [ "string" ], "Media": { "MediaFileUri": "string", "RedactedMediaFileUri": "string" }, "MediaFormat": "string", "MediaSampleRateHertz": number, "ModelSettings": { "LanguageModelName": "string" }, "Settings": { "ChannelIdentification": boolean, "MaxAlternatives": number, "MaxSpeakerLabels": number, "ShowAlternatives": boolean, "ShowSpeakerLabels": boolean, "VocabularyFilterMethod": "string", "VocabularyFilterName": "string", "VocabularyName": "string" }, "StartTime": number, "Subtitles": { "Formats": [ "string" ], "OutputStartIndex": number, "SubtitleFileUris": [ "string" ] }, "Tags": [ { "Key": "string", "Value": "string" } ], "Transcript": { "RedactedTranscriptFileUri": "string", "TranscriptFileUri": "string" }, "TranscriptionJobName": "string", "TranscriptionJobStatus": "string" } }

Elementi di risposta

Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.

I dati seguenti vengono restituiti in formato JSON mediante il servizio.

TranscriptionJob

Fornisce informazioni dettagliate sul processo di trascrizione corrente, incluso lo stato del lavoro e, se applicabile, il motivo dell'errore.

Tipo: TranscriptionJob oggetto

Errori

Per informazioni sugli errori comuni a tutte le operazioni, consultare Errori comuni.

BadRequestException

La tua richiesta non ha superato uno o più test di convalida. Ciò può verificarsi quando l'entità che stai cercando di eliminare non esiste o se si trova in uno stato non terminale (ad esempioIN PROGRESS). Per ulteriori informazioni, consulta il campo del messaggio di eccezione.

Codice di stato HTTP: 400

ConflictException

Esiste già una risorsa con questo nome. I nomi delle risorse devono essere univoci all'interno di unAccount AWS.

Codice di stato HTTP: 400

InternalFailureException

Si è verificato un errore interno. Controlla il messaggio di errore, correggi il problema e riprova con la richiesta.

Codice di stato HTTP: 500

LimitExceededException

Hai inviato troppe richieste o il file di input è troppo lungo. Attendi prima di riprovare la richiesta oppure utilizza un file più piccolo e riprova la richiesta.

Codice di stato HTTP: 400

Vedi anche

Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue: