CreateLanguageModel - Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CreateLanguageModel

新しいカスタム言語モデルを作成します。

新しい言語モデルを作成するときには、以下を指定する必要があります。

  • ワイドバンド (オーディオサンプルレートが 16,000 Hz 以上) またはナローバンド (オーディオサンプルレートが 16,000 Hz 未満) のベースモデルが必要な場合

  • トレーニングファイルとチューニングファイルの場所 (Amazon S3 URI にする必要があります)

  • モデルの言語

  • モデルのユニークな名前

詳細については、「カスタム言語モデル」を参照してください。

リクエストの構文

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "Tags": [ { "Key": "string", "Value": "string" } ] }

リクエストパラメータ

すべてのアクションに共通のパラメータの詳細については、「共通パラメータ」を参照してください。

リクエストは以下の JSON 形式のデータを受け入れます。

BaseModelName

カスタム言語モデルの作成に使用する Amazon Transcribe 標準言語モデル、またはベースモデル。Amazon Transcribe では、基本モデル用にワイドバンドとナローバンドの 2 つのオプションがあります。

文字起こししたいオーディオのサンプルレートが 16,000 Hz 以上の場合は、を選択しますWideBand。サンプルレートが 16,000 Hz 未満の音声を文字起こしする場合は、を選択しますNarrowBand

タイプ: 文字列

有効な値: NarrowBand | WideBand

必須: はい

InputDataConfig

新しいカスタム言語モデルを作成するために使用するトレーニングデータの Amazon S3 ロケーションと、このロケーションにアクセスするための権限が含まれます。

を使用する際にはInputDataConfig、トレーニングデータの Amazon S3 ロケーションとDataAccessRoleArn、指定した Amazon S3 ロケーションへのアクセス権限を持つロールの Amazon リソースネーム (ARN) というサブパラメータを含める必要があります。S3UriオプションでTuningDataS3Uri、チューニングデータの Amazon S3 の場所を含めることができます。トレーニングデータやチューニングデータ用に別の Amazon S3 ロケーションを指定する場合、使用する ARN には両方のロケーションにアクセスする権限が必要です。

型: InputDataConfig オブジェクト

必須: はい

LanguageCode

モデルの言語を表す言語コード。各カスタム言語モデルには 1 つの言語の用語のみを含める必要があり、カスタム言語モデル用に選択する言語は、トレーニングおよびチューニングデータの言語と一致する必要があります。

サポートされる言語とそれに関連する言語コードのリストについては、「サポートされる言語」の表を参照してください。Amazonen-US Transcribe Medical でサポートされている唯一の言語であることに注意してください。

言語モデルでは、モデルと同じ言語でファイルを文字起こしする場合のみ使用できます。たとえば、US English (en-US) を使用してカスタム言語モデルを作成した場合、このモデルは英語の音声を含むファイルにのみ適用できます。

タイプ: 文字列

有効な値: en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

必須: はい

ModelName

言語モデルにユーザーが選択したユニークな言語モデルの一意の名前。

この名前は大文字と小文字が区別され、スペースを含めることはできません。また、内では一意でなければなりませんAWS アカウント。既存の言語モデルと同じ名前で新しい言語モデルを作成しようとすると、ConflictExceptionエラーが表示されます。

タイプ: 文字列

長さの制限: 最小長は 1 です。最大長は 200 です。

パターン: ^[0-9a-zA-Z._-]+

必須: はい

Tags

この新しいモデルの作成時に、キーと値のペア形式で 1 つ以上のカスタム言語モデルに追加します。

Amazon Transcribe タグの使用については、タグ付けリソースを参照してください

型: Tag オブジェクトの配列

配列メンバー: 最小数は 1 項目です。最大 200 項目。

必須: いいえ

レスポンスの構文

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "ModelStatus": "string" }

レスポンス要素

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

サービスから以下のデータが JSON 形式で返されます。

BaseModelName

カスタム言語モデルの作成時に指定した Amazon Transcribe 標準言語モデル、またはベースモデル。

タイプ: 文字列

有効な値: NarrowBand | WideBand

InputDataConfig

データアクセスロール ARN (Amazon リソースネーム) と、トレーニング () およびチューニング (S3UriTuningDataS3Uri) データ用に指定した Amazon S3 ロケーションが一覧表示されます。

型: InputDataConfig オブジェクト

LanguageCode

カスタム言語モデルに選択した言語モデルに選択した言語モデル。

タイプ: 文字列

有効な値: en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

ModelName

カスタム言語モデルの名前。

タイプ: 文字列

長さの制限: 最小長は 1 です。最大長は 200 です。

Pattern: ^[0-9a-zA-Z._-]+

ModelStatus

カスタム言語モデルの状態。ステータスが「」COMPLETED の場合は、モデルは使用可能です。

タイプ: 文字列

有効な値: IN_PROGRESS | FAILED | COMPLETED

エラー

すべてのアクションに共通のエラーについては、「共通エラー」を参照してください。

BadRequestException

リクエストは 1 つ以上の検証テストに合格しませんでした。これは、削除しようとしているエンティティが存在しない場合、または非終端状態 (などIN PROGRESS) に発生することがあります。詳細については、例外のフィールドを参照してください。

HTTP ステータスコード: 400

ConflictException

この名前のリソースは既に存在します。リソース名は内で一意である必要がありますAWS アカウント。

HTTP ステータスコード: 400

InternalFailureException

インターナルエラーが発生しました。エラーメッセージを確認して、問題を修正して、リクエストを再試行してください。

HTTP ステータスコード: 500

LimitExceededException

送信されたリクエストが多すぎるか、または入力ファイルが長すぎます。リクエストを再試行する前に待つか、またはサイズの小さいファイルを使用してリクエストを再試行してください。

HTTP ステータスコード: 400

以下の資料も参照してください。

言語固有の AWS SDK のいずれかでこの API を使用する方法の詳細については、以下を参照してください。