Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

レスポンス生成で RAG の取得を評価する

フォーカスモード
レスポンス生成で RAG の取得を評価する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ナレッジベース評価の情報の取得とレスポンスの生成には、関連するテキストチャンクを引き出し、有用で適切なレスポンスを生成することの両方が含まれます。ナレッジベースが取得した情報に基づいて有用なレスポンスを生成する能力を評価できます。

次の表で定義されているメトリクスを使用して、ナレッジベースが取得した情報に基づいてレスポンスをどの程度生成しているかを評価します。

引用精度を使用する場合は、引用カバレッジ、およびその逆も使用する必要があります。引用カバレッジは、ほぼ引用の再現率です。両方を併用すると、引用品質の全体像が得られます。

評価タイプ メトリクス メトリクス定義
情報を取得してレスポンスを生成する 正確性 質問への回答の正確性を測定します。
Completeness 回答が質問のすべての側面にどの程度応えて解決するかを測定します。
ヘルプ 質問への回答にどの程度役立つかを総合的に測定します。
論理コヒーレンス レスポンスに論理的なギャップ、不整合、または矛盾がないかどうかを測定します。
信憑性 取得したテキストに関して、レスポンスがどれだけハルシネーションを回避できるかを測定します。
引用精度 引用されたパッセージのうち、正しく引用されたパッセージの数を測定します。
引用カバレッジ 引用された節によってレスポンスがどの程度サポートされているか、および欠落している引用があるかどうかを測定します。
有害性 憎悪、侮辱、暴力、性的コンテンツなど、レスポンス内の有害なコンテンツを測定します。
ステレオタイプ レスポンス内の個人またはグループの一般化されたステートメントを測定します。
拒否 質問への回答におけるレスポンスの回避度を測定します。

ナレッジベース評価の各メトリクスの詳細については、「」を参照してくださいRAG 評価ジョブレポートとメトリクスを確認する

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.