取得拡張生成

基盤モデルは通常オフラインでトレーニングされるため、モデルはモデルのトレーニング後に作成されたどのデータにも依存しません。さらに、基盤モデルは非常に一般的なドメインコーパスでトレーニングされるため、ドメイン固有のタスクにはあまり効果的ではありません。Retrieval Augmented Generation (RAG) を使用すると、基盤モデルの外側からデータを取得し、コンテキスト内で取得した関連するデータを追加してプロンプトを補強できます。RAG モデルアーキテクチャの詳細については、「Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks」を参照してください。

ではRAG、プロンプトの拡張に使用される外部データは、ドキュメントリポジトリ、データベース、などの複数のデータソースから取得できますAPIs。最初のステップは、関連性検索を実行するために、ドキュメントとユーザークエリを互換性のある形式に変換することです。形式を互換性のあるものにするために、ドキュメントコレクションまたはナレッジライブラリ、およびユーザーが送信したクエリを、埋め込み言語モデルを使用して数値表現に変換します。埋め込みとは、ベクトル空間でテキストに数値表現を与えるプロセスです。RAG モデルアーキテクチャは、ナレッジライブラリのベクトル内のユーザークエリの埋め込みを比較します。その後、元のユーザープロンプトに、ナレッジライブラリ内の類似ドキュメントからの関連コンテキストが追加されます。次に、この拡張プロンプトが基盤モデルに送信されます。ナレッジライブラリと関連する埋め込みは非同期で更新できます。

A model architecture diagram of Retrieval Augmented Generation (RAG).

取得したドキュメントは、プロンプトを補強するのに役立つコンテキストを含むのに十分な大きさで、プロンプトの最大シーケンス長に収まる大きさである必要があります。の一般的なテキスト埋め込み (GTE) JumpStart モデルなどのタスク固有のモデルを使用してHugging Face、プロンプトやナレッジライブラリドキュメントの埋め込みを提供できます。プロンプトとドキュメントの埋め込みを比較して最も関連性の高いドキュメントを見つけたら、補足コンテキストを使用して新しいプロンプトを作成します。次に、拡張プロンプトを選択したテキスト生成モデルに渡します。

サンプルノートブックの例

RAG 基盤モデルソリューションの詳細については、次のサンプルノートブックを参照してください。

Amazon SageMaker サンプルリポジトリのクローンを作成して、Studio 内の任意の Jupyter 環境で使用可能な JumpStart 基盤モデル例を実行できます。で Jupyter を作成およびアクセスするために使用できるアプリケーションの詳細については SageMaker、「」を参照してくださいAmazon SageMaker Studio でサポートされているアプリケーション。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

インストラクションベースの微調整

モデルを評価する