StartTranscriptionJob - Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

StartTranscriptionJob

メディアファイルからの音声を文字起こしし、リクエストに含めるように選択した追加のリクエストパラメータを適用します。

作るにはStartTranscriptionJobリクエストするには、まずメディアファイルを Amazon S3 バケットにアップロードする必要があります。次に、Mediaパラメータ。

には次のパラメータが含まれますStartTranscriptionJobリクエスト:

  • region:AWS リージョンあなたがリクエストしている場所。のリストについてはAWS リージョンAmazon Transcribe でサポートされています。を参照してくださいAmazon Transcribe エンドポイントとクォータ

  • TranscriptionJobName: トランスクリプションジョブ用に作成した、自分の中で一意のカスタム名AWS アカウント。

  • Media(MediaFileUri): メディアファイルの Amazon S3 の場所。

  • の一つLanguageCode,IdentifyLanguage、またはIdentifyMultipleLanguages: メディアファイルの言語がわかっている場合は、LanguageCodeパラメータ。有効な言語コードはすべてサポートされている言語テーブル。メディアで話されている言語がわからない場合は、どちらかを使ってくださいIdentifyLanguageまたはIdentifyMultipleLanguagesAmazon Transcribe に言語を識別させてください。

リクエストの構文

{ "ContentRedaction": { "PiiEntityTypes": [ "string" ], "RedactionOutput": "string", "RedactionType": "string" }, "IdentifyLanguage": boolean, "IdentifyMultipleLanguages": boolean, "JobExecutionSettings": { "AllowDeferredExecution": boolean, "DataAccessRoleArn": "string" }, "KMSEncryptionContext": { "string" : "string" }, "LanguageCode": "string", "LanguageIdSettings": { "string" : { "LanguageModelName": "string", "VocabularyFilterName": "string", "VocabularyName": "string" } }, "LanguageOptions": [ "string" ], "Media": { "MediaFileUri": "string", "RedactedMediaFileUri": "string" }, "MediaFormat": "string", "MediaSampleRateHertz": number, "ModelSettings": { "LanguageModelName": "string" }, "OutputBucketName": "string", "OutputEncryptionKMSKeyId": "string", "OutputKey": "string", "Settings": { "ChannelIdentification": boolean, "MaxAlternatives": number, "MaxSpeakerLabels": number, "ShowAlternatives": boolean, "ShowSpeakerLabels": boolean, "VocabularyFilterMethod": "string", "VocabularyFilterName": "string", "VocabularyName": "string" }, "Subtitles": { "Formats": [ "string" ], "OutputStartIndex": number }, "Tags": [ { "Key": "string", "Value": "string" } ], "TranscriptionJobName": "string" }

リクエストパラメータ

すべてのアクションに共通のパラメータの詳細については、「共通パラメータ」を参照してください。

リクエストは以下の JSON 形式のデータを受け入れます。

ContentRedaction

文字起こし内の特定の個人識別情報 (PII) を編集したり、フラグを付けたりできるようにします。使用するものContentRedactionでは、サブパラメータも含める必要があります。PiiEntityTypes,RedactionOutput、およびRedactionType

型: ContentRedaction オブジェクト

必須: いいえ

IdentifyLanguage

文字起こしジョブリクエストで言語を自動的に識別できるようにします。メディアファイルに言語が 1 つしかない場合は、このパラメータを使用してください。メディアに複数の言語が含まれている場合は、IdentifyMultipleLanguages代わりに。

含める場合IdentifyLanguage、オプションで言語コードのリストを含めることができます。LanguageOptions、メディアファイルにあると思われるもの。を含むLanguageOptions制限するIdentifyLanguage指定した言語オプションのみに適用します。これにより、文字起こしの精度が向上します。

カスタム言語モデル、カスタムボキャブラリ、またはカスタムボキャブラリフィルターを自動言語識別リクエストに適用する場合は、以下を含めてくださいLanguageIdSettings関連するサブパラメータを使って (VocabularyName,LanguageModelName、およびVocabularyFilterName). 含める場合LanguageIdSettings、以下も含むLanguageOptions

以下のいずれかを含める必要があることに注意してくださいLanguageCode,IdentifyLanguage、またはIdentifyMultipleLanguagesリクエストです。これらのパラメータを複数含めると、文字起こしジョブは失敗します。

Type: ブール値

必須: いいえ

IdentifyMultipleLanguages

トランスクリプションジョブリクエストで自動多言語識別を可能にします。メディアファイルに複数の言語が含まれている場合は、このパラメータを使用してください。メディアに含まれる言語が 1 つだけの場合は、IdentifyLanguage代わりに。

含める場合IdentifyMultipleLanguages、オプションで言語コードのリストを含めることができます。LanguageOptions、メディアファイルにあると思われるもの。を含むLanguageOptions制限するIdentifyLanguage指定した言語オプションのみに適用します。これにより、文字起こしの精度が向上します。

自動言語識別リクエストにカスタムボキャブラリまたはカスタムボキャブラリフィルタを適用する場合は、以下を含めてくださいLanguageIdSettings関連するサブパラメータを使って (VocabularyNameそしてVocabularyFilterName). 含める場合LanguageIdSettings、以下も含むLanguageOptions

以下のいずれかを含める必要があることに注意してくださいLanguageCode,IdentifyLanguage、またはIdentifyMultipleLanguagesリクエストです。これらのパラメータを複数含めると、文字起こしジョブは失敗します。

Type: ブール値

必須: いいえ

JobExecutionSettings

文字起こしジョブの処理方法を制御できます。現在、唯一のJobExecutionSettings選択できる修正は、を使用してジョブキューを有効にすることですAllowDeferredExecutionサブパラメータ。

含める場合JobExecutionSettingsリクエストには、サブパラメータも含める必要があります。AllowDeferredExecutionそしてDataAccessRoleArn

型: JobExecutionSettings オブジェクト

必須: いいえ

KMSEncryptionContext

暗号化コンテキストペアとして知られる、プレーンテキスト、非機密キー:値ペアのマップで、データのセキュリティを強化します。詳細については、次を参照してください。AWS KMS暗号化コンテキストそしての非対称キーAWS KMS

Type: 文字列から文字列へのマップ

マップエントリ: 最大数は 10 項目です。

キーの長さの制約: 最小長は 1 です。 最大長は 2,000 です。

キーパターン: .*\S.*

値の長さの制約: 最小長は 1 です。 最大長は 2,000 です。

値のパターン: .*\S.*

必須: いいえ

LanguageCode

入力メディアファイルで話されている言語を表す言語コード。

メディアファイルで使用されている言語が不明な場合は、次の使用を検討してくださいIdentifyLanguageまたはIdentifyMultipleLanguages自動言語識別を有効にします。

以下のいずれかを含める必要があることに注意してくださいLanguageCode,IdentifyLanguage、またはIdentifyMultipleLanguagesリクエストです。これらのパラメータを複数含めると、文字起こしジョブは失敗します。

サポートされている言語とそれに関連する言語コードの一覧については、サポートされている言語テーブル。

注記

現代標準アラビア語で音声を書き写すには(ar-SA) の場合、メディアファイルは 16,000 Hz 以上のサンプリングレートによるエンコードが必要です。

Type: 文字列

有効な値: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ

必須: いいえ

LanguageIdSettings

リクエストで自動言語識別を使用していて、カスタム言語モデル、カスタムボキャブラリ、またはカスタムボキャブラリフィルターを適用したい場合は、以下を含めてくださいLanguageIdSettings関連するサブパラメータを使って (VocabularyName,LanguageModelName、およびVocabularyFilterName). 多言語識別に注意してください(IdentifyMultipleLanguages) はカスタム言語モデルをサポートしていません。

LanguageIdSettings2 ~ 5 つの言語コードをサポートします。含める各言語コードには、カスタム言語モデル、カスタムボキャブラリ、およびカスタムボキャブラリフィルターを関連付けることができます。指定する言語コードは、関連するカスタム言語モデル、カスタムボキャブラリ、およびカスタムボキャブラリフィルターの言語と一致する必要があります。

含めることをお勧めしますLanguageOptions使用するものLanguageIdSettings正しい言語の方言が識別されていることを確認するためです。たとえば、カスタムボキャブラリを指定するとen-USしかし Amazon Transcribe は、メディアで話されている言語はen-AU、カスタムボキャブラリーではないあなたの転写に適用されます。含める場合LanguageOptionsインクルードen-US唯一の英語方言として、あなたのカスタムボキャブラリーですあなたの転写に適用されます。

リクエストにカスタム言語モデルを含めたい場合は以下のようになります。自動言語識別を使いたい、代わりに使って ModelSettings パラメータとLanguageModelNameサブパラメータ。カスタムボキャブラリーまたはカスタムボキャブラリーフィルター(あるいはその両方)をリクエストに含めたい場合は以下のようになります。自動言語識別を使いたい、代わりに使って Settings パラメータとVocabularyNameまたはVocabularyFilterName(または両方) サブパラメータ。

Type: 文字列にLanguageIdSettingsオブジェクトマップ

マップエントリ: 最大数は 5 項目です。

有効なキー: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ

必須: いいえ

LanguageOptions

メディアに存在すると思われる言語を表す言語コードを 2 つ以上指定できます。5 つ以上含めることはお勧めしません。どの言語が存在するのかわからない場合は、このパラメータを含めないでください。

含める場合LanguageOptionsリクエストには、以下も含める必要がありますIdentifyLanguage

詳細情報は、を参照してください。サポートされている言語

現代標準アラビア語で音声を書き写すには(ar-SA) の場合、メディアファイルは 16,000 Hz 以上のサンプリングレートによるエンコードが必要です。

Type: 文字列の配列

配列メンバー: 最小数は 1 項目です。

有効な値: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ

必須: いいえ

Media

リクエストで使用するメディアファイルの Amazon S3 ロケーションを記述します。

型: Media オブジェクト

必須: はい

MediaFormat

入力メディアファイルの形式を指定します。

Type: 文字列

有効な値: mp3 | mp4 | wav | flac | ogg | amr | webm

必須: いいえ

MediaSampleRateHertz

入力メディアファイル内のオーディオトラックのサンプルレート (単位:ヘルツ)。

メディアのサンプルレートを指定しない場合、Amazon Transcribe がそれを判断します。サンプルレートを指定する場合は、Amazon Transcribe で検出されたレートと一致させる必要があります。指定した値と検出された値が一致しない場合、ジョブは失敗します。ほとんどの場合は省略できますMediaSampleRateHertzAmazon Transcribe にサンプルレートを決定させてください。

Type: 整数

有効範囲: 最小値は 8,000 です。48,000 の最大値。

必須: いいえ

ModelSettings

文字起こしジョブに含めるカスタム言語モデルを指定します。含める場合ModelSettingsリクエストには、以下を含める必要がありますLanguageModelNameサブパラメータ。

詳細については、次を参照してください。カスタム言語モデル

型: ModelSettings オブジェクト

必須: いいえ

OutputBucketName

文字起こし出力を保存する Amazon S3 バケットの名前です。含めないでください。S3://指定されたバケットのプレフィックス。

出力をこのバケットのサブフォルダに移動させる場合は、OutputKeyパラメータ;OutputBucketNameバケットの名前だけを受け付けます。

たとえば、出力を次の場所に保存したい場合S3://DOC-EXAMPLE-BUCKET、を設定しますOutputBucketNameDOC-EXAMPLE-BUCKET。ただし、出力を保存したい場合はS3://DOC-EXAMPLE-BUCKET/test-files/、を設定しますOutputBucketNameDOC-EXAMPLE-BUCKETそしてOutputKeytest-files/

Amazon Transcribe には、指定したロケーションを使用するアクセス権限が必要であることに注意してください。Amazon S3 のアクセス権限は、AWS Management Console。以下の資料も参照してください。IAM ユーザーロールに必要な権限

指定しなかった場合OutputBucketNameでは、トランスクリプトはサービス管理の Amazon S3 バケットに保存され、トランスクリプトにアクセスするための URI が提供されます。

Type: 文字列

長さの制約: 最大長は 64 文字です。

パターン: [a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]

必須: いいえ

OutputEncryptionKMSKeyId

文字起こし出力の暗号化に使用する KMS キー。

にあるキーを使用する場合現在 AWS アカウントでは、次の 4 つの方法のいずれかで KMS キーを指定できます。

  1. KMS キー ID 自体を使用してください。例: 1234abcd-12ab-34cd-56ef-1234567890ab

  2. KMS キー ID にはエイリアスを使用します。例: alias/ExampleAlias

  3. KMS キー ID には Amazon リソースネーム (ARN) を使用します。例: arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab

  4. KMS キーエイリアスには ARN を使用してください。例: arn:aws:kms:region:account-ID:alias/ExampleAlias

にあるキーを使用する場合違う AWS アカウント現在よりもAWS アカウントでは、KMS キーを次の 2 つのいずれかに指定します。

  1. KMS キー ID には ARN を使用してください。例: arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab

  2. KMS キーエイリアスには ARN を使用してください。例: arn:aws:kms:region:account-ID:alias/ExampleAlias

暗号化キーを指定しない場合、出力はデフォルトの Amazon S3 キー (SSE-S3) で暗号化されます。

KMS キーを指定して出力を暗号化する場合は、を使用して出力場所も指定する必要があります。OutputLocationパラメータ。

を作成しているユーザーはStartCallAnalyticsJobリクエストには、指定された KMS キーを使用するアクセス権限が必要です。

Type: 文字列

長さの制約: 最小長は 1 です。 最大長は 2,048 です。

パターン: ^[A-Za-z0-9][A-Za-z0-9:_/+=,@.-]{0,2048}$

必須: いいえ

OutputKey

と組み合わせて使用してくださいOutputBucketNameトランスクリプトの出力場所を指定し、オプションで出力ファイルの一意の名前を指定します。文字起こし出力のデフォルト名は、文字起こしジョブに指定した名前と同じです(TranscriptionJobName).

使用方法の例を次に示します。OutputKey:

  • として DOC-EXAMPLE-BUCKET 'を指定した場合OutputBucketNameそして「my-transcript.json」はOutputKey、あなたのトランスクリプションの出力パスはs3://DOC-EXAMPLE-BUCKET/my-transcript.json

  • を指定する場合は、'my-first-transcription'としてTranscriptionJobName、'DOC-EXAMPLE-BUCKET' としてOutputBucketName、そして「私のトランスクリプト」はOutputKey、あなたのトランスクリプションの出力パスはs3://DOC-EXAMPLE-BUCKET/my-transcript/my-first-transcription.json

  • として DOC-EXAMPLE-BUCKET 'を指定した場合OutputBucketNameそして「テストファイル/my-transcript.json」はOutputKey、あなたのトランスクリプションの出力パスはs3://DOC-EXAMPLE-BUCKET/test-files/my-transcript.json

  • を指定する場合は、'my-first-transcription'としてTranscriptionJobName、'DOC-EXAMPLE-BUCKET' としてOutputBucketName、そして「テストファイル/私のトランスクリプト」はOutputKey、あなたのトランスクリプションの出力パスはs3://DOC-EXAMPLE-BUCKET/test-files/my-transcript/my-first-transcription.json

存在しない Amazon S3 バケットサブフォルダの名前を指定すると、自動的に作成されます。

Type: 文字列

長さの制約: 最小長は 1 です。 最大長は 1,024 です。

パターン: [a-zA-Z0-9-_.!*'()/]{1,1024}$

必須: いいえ

Settings

で追加のオプション設定を指定してくださいStartTranscriptionJobチャンネル識別、代替トランスクリプション、スピーカーの分割を含むリクエスト。これを使ってカスタムボキャブラリーやボキャブラリーフィルターを適用できます。

カスタムボキャブラリーまたはカスタムボキャブラリーフィルター(あるいはその両方)をリクエストに含めたい場合は以下のようになります。自動言語識別を使いたい、使ってSettingsVocabularyNameまたはVocabularyFilterName(または両方) サブパラメータ。

リクエストで自動言語識別を使用していて、カスタム言語モデル、カスタムボキャブラリ、またはカスタムボキャブラリフィルターを含めたい場合は、代わりに LanguageIdSettings パラメータとLanguageModelName,VocabularyNameまたはVocabularyFilterNameサブパラメータ。

型: Settings オブジェクト

必須: いいえ

Subtitles

入力メディア用の字幕ファイルを作成します。WebVTT (*.vtt) と SubRip (*.srt) フォーマット。

型: Subtitles オブジェクト

必須: いいえ

Tags

この新しいジョブの開始時に、キーと値のペア形式で 1 つ以上のカスタムタグを新しい文字起こしジョブに追加します。

Amazon Transcribe でのタグの使用の詳細については、を参照してください。リソースのタグ付け

Type: の配列Tagオブジェクト

配列メンバー: 最小数は 1 項目です。最大 200 項目。

必須: いいえ

TranscriptionJobName

文字起こし作業用にあなたが選んだユニークな名前。指定した名前は、文字起こし出力ファイルのデフォルト名としても使用されます。文字起こし出力に別の名前を指定したい場合は、OutputKeyパラメータ。

この名前は大文字と小文字が区別され、スペースを含むことはできません。また、名前全域で一意である必要がありますAWS アカウント。既存のジョブと同じ名前の新しいジョブを作成しようとすると、ConflictExceptionというエラーが表示される。

Type: 文字列

長さの制約: 最小長は 1 です。 最大長は 200 です。

Pattern: ^[0-9a-zA-Z._-]+

必須: はい

レスポンスの構文

{ "TranscriptionJob": { "CompletionTime": number, "ContentRedaction": { "PiiEntityTypes": [ "string" ], "RedactionOutput": "string", "RedactionType": "string" }, "CreationTime": number, "FailureReason": "string", "IdentifiedLanguageScore": number, "IdentifyLanguage": boolean, "IdentifyMultipleLanguages": boolean, "JobExecutionSettings": { "AllowDeferredExecution": boolean, "DataAccessRoleArn": "string" }, "LanguageCode": "string", "LanguageCodes": [ { "DurationInSeconds": number, "LanguageCode": "string" } ], "LanguageIdSettings": { "string" : { "LanguageModelName": "string", "VocabularyFilterName": "string", "VocabularyName": "string" } }, "LanguageOptions": [ "string" ], "Media": { "MediaFileUri": "string", "RedactedMediaFileUri": "string" }, "MediaFormat": "string", "MediaSampleRateHertz": number, "ModelSettings": { "LanguageModelName": "string" }, "Settings": { "ChannelIdentification": boolean, "MaxAlternatives": number, "MaxSpeakerLabels": number, "ShowAlternatives": boolean, "ShowSpeakerLabels": boolean, "VocabularyFilterMethod": "string", "VocabularyFilterName": "string", "VocabularyName": "string" }, "StartTime": number, "Subtitles": { "Formats": [ "string" ], "OutputStartIndex": number, "SubtitleFileUris": [ "string" ] }, "Tags": [ { "Key": "string", "Value": "string" } ], "Transcript": { "RedactedTranscriptFileUri": "string", "TranscriptFileUri": "string" }, "TranscriptionJobName": "string", "TranscriptionJobStatus": "string" } }

レスポンス要素

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

サービスから以下のデータが JSON 形式で返されます。

TranscriptionJob

ジョブのステータス、該当する場合は失敗の理由など、現在の文字起こしジョブに関する詳細情報を提供します。

型: TranscriptionJob オブジェクト

エラー

すべてのアクションに共通のエラーについては、「共通エラー」を参照してください。

BadRequestException

リクエストは 1 つ以上の検証テストに合格しませんでした。これは、削除しようとしているエンティティが存在しない場合、または非終端状態 (例:IN PROGRESS). 例外の詳細については、メッセージフィールドを参照してください。

HTTP ステータスコード: 400

ConflictException

この名前のリソースは既に存在します。リソース名は内で一意である必要がありますAWS アカウント。

HTTP ステータスコード: 400

InternalFailureException

インターナルエラーが発生しました。エラーメッセージを確認して、問題を修正して、リクエストを再試行してください。

HTTP ステータスコード: 500

LimitExceededException

送信されたリクエストが多すぎるか、または入力ファイルが長すぎます。リクエストを再試行する前に待つか、サイズの小さいファイルを使用してリクエストを再試行してください。

HTTP ステータスコード: 400

以下の資料も参照してください。

言語固有の AWS SDK のいずれかでこの API を使用する方法の詳細については、以下を参照してください。