一般的なテキスト生成 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

一般的なテキスト生成

重要

一般的なテキスト生成では、Cohereモデルが毒性評価を正常に完了できないという既知の問題があります。

一般的なテキスト生成は、チャットボットを含むアプリケーションで使用されるタスクです。一般的な質問に対してモデルが生成するレスポンスは、モデルのトレーニングに使用されるテキストに含まれる正確さ、関連性、バイアスの影響を受けます。

以下の組み込みデータセットには、一般的なテキスト生成タスクでの使用に適したプロンプトが含まれています。

オープンエンド型言語生成データセットのバイアス (BOLD)

オープンエンド型言語生成データセットのバイアス (BOLD) は、職業、性別、人種、宗教的イデオロギー、政治的イデオロギーの 5 つの分野に焦点を当てて、一般的なテキスト生成における公平性を評価するデータセットです。このデータセットには、23,679 のテキスト生成プロンプトが含まれています。

RealToxicityPrompts

RealToxicityPrompts は毒性を評価するデータセットです。このデータセットを使用すると、モデルは人種差別的、性差別的、またはその他の有害な言葉を生成します。このデータセットには、100,000 のテキスト生成プロンプトが含まれています。

T-Rex: ナレッジベーストリプルを使用した自然言語の大規模調整 (TREX)

TREX は、ウィキペディアから抽出されたナレッジベーストリプル (KBT) で構成されるデータセットです。KBT は自然言語処理 (NLP) や知識表現に使用されるデータ構造の一種です。主語、述語、目的語で構成され、主語と目的語はリレーションによってリンクされています。ナレッジベーストリプル (KBT) の例として、「ジョージ・ワシントンはアメリカ合衆国の大統領だった」などが挙げられます。主語は「ジョージ・ワシントンは」、述語は「大統領だった」、目的語は「アメリカ合衆国の」です。

WikiText2

WikiText2 HuggingFace は一般的なテキスト生成に使用されるプロンプトを含むデータセットです。

次の表は、計算済みのメトリクスと、自動モデル評価ジョブに使用できる推奨の組み込みデータセットをまとめたものです。またはサポートされている AWS SDK を使用して使用可能なビルトインデータセットを正常に指定するには AWS CLI、「ビルトインデータセット (API)」列のパラメータ名を使用してください。

Amazon Bedrock の一般的なテキスト生成に使用できる組み込みデータセット
タスクタイプ メトリクス ビルトインデータセット (コンソール) ビルトインデータセット (API) 計算済みのメトリクス
一般的なテキスト生成 正解率 TREX Builtin.T-REx リアルワールドナレッジ (RWK) スコア
堅牢性

BOLD

Builtin.BOLD 単語エラー率
WikiText2 Builtin.WikiText2
TREX Builtin.T-REx
有害性

RealToxicityPrompts

Builtin.RealToxicityPrompts 有害性
BOLD Builtin.Bold

各組み込みデータセットの計算済みのメトリクスの計算方法の詳細については、「モデル評価ジョブの結果」を参照してください。