翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ドキュメントが変換されるベクトル埋め込みを保存するには、ベクトルストアを使用します。Amazon Bedrock で Amazon OpenSearch Serverless にベクトルインデックスを自動的に作成する場合は、この前提条件をスキップして Amazon Bedrock ナレッジベースでデータソースに接続してナレッジベースを作成する に進みます。
標準の浮動小数点 (float32) ベクトル埋め込みの代わりにバイナリベクトル埋め込みを保存する場合は、バイナリベクトルをサポートするベクトルストアを使用する必要があります。
注記
Amazon OpenSearch Serverless クラスターと Amazon OpenSearch Managed クラスターは、バイナリベクトルの保存をサポートする唯一のベクトルストアです。
独自のサポートされているベクトルストアを設定して、データのベクトル埋め込み表現をインデックス化できます。次のデータ用にフィールドを作成できます。
-
選択した埋め込みモデルによってデータソースのテキストから生成されたベクトル用のフィールド。
-
データソース内のファイルから抽出されたテキストチャンク用フィールド。
-
Amazon Bedrock が管理するソースファイルのメタデータのフィールド。
-
(Amazon Aurora データベースを使用してメタデータのフィルタリングを設定する場合) ソースファイルに関連付けるメタデータのフィールド。他のベクトルストアでフィルタリングを設定する場合は、フィルタリングのためにこれらのフィールドを設定する必要はありません。
KMS キーを使用して、サードパーティーのベクトルストアを暗号化できます。詳細については、「Encryption of knowledge base resources」を参照してください。
ベクトルインデックスの作成に使用するベクトルストアサービスに対応するタブを選択します。
-
でアクセス許可を設定し、Amazon OpenSearch Serverless でベクトル検索コレクションを作成するには AWS Management Console、「Amazon OpenSearch Service デベロッパーガイド」の「ベクトル検索コレクションの使用」のステップ 1 と 2 に従います。コレクションを設定するときは、以下の考慮事項に注意してください。
-
コレクションに任意の名前と説明を付けます。
-
コレクションをプライベートにするには、[セキュリティ] セクションの [標準作成] を選択します。次に、[ネットワークアクセス設定] セクションで、[アクセスタイプ] として [VPC] を選択し、VPC エンドポイントを選択します。Amazon OpenSearch Serverless コレクションの VPC エンドポイントの設定の詳細については、「Amazon OpenSearch Service デベロッパーガイド」の「Access Amazon OpenSearch Serverless using an interface endpoint (AWS PrivateLink)」を参照してください。
-
-
コレクションを作成したら、ナレッジベースを作成するときに備えて [コレクション ARN] を書き留めます。
-
左側のナビゲーションペインの [サーバーレス] で [コレクション] を選択します。次に、ベクトル検索コレクションを選択します。
-
[インデックス] タブを選択します。次に、[ベクトルインデックスを作成] を選択します。
-
[ベクトルインデックスの詳細] セクションで、ベクトルインデックス名フィールドに [ベクトルインデックスの名前] を入力します。
-
[ベクトルフィールド] セクションで[ベクトルフィールドの追加] を選択します。Amazon Bedrock は、データソースのベクトル埋め込みをこのフィールドに保存します。次の設定の詳細を入力します。
-
ベクトルフィールド名 – フィールドの名前を指定します (例:
embeddings
)。 -
エンジン – 検索に使用するベクトルエンジン。[faiss] を選択します。
-
ディメンション - ベクトルのディメンション (次元) の数。ベクトルに含めるディメンションの数を決定するには、次の表を参照してください。
モデル ディメンション Titan G1 埋め込み - テキスト 1,536 Titan V2 埋め込み - テキスト 1,024、512、256 Cohere Embed 英語 1,024 Cohere Embed 多言語 1,024 -
距離メトリクス - ベクトル間の類似性を測定するために使用されるメトリクス。浮動小数点ベクトル埋め込みにはユークリッド語を使用することをお勧めします。
-
-
[メタデータの管理] セクションを展開し、ナレッジベースがベクトルを使用して取得できる追加のメタデータを保存するよう、ベクトルインデックスを設定します。次の表は、各フィールドに対して指定するフィールドと値を示しています。
フィールドの説明 フィールドのマッピング データ型 フィルタリング可能 Amazon Bedrock はデータから未加工テキストをチャンク化し、チャンクをこのフィールドに保存します。 選択した名前 (例: text
)String 真 Amazon Bedrock は、ナレッジベースに関連するメタデータをこのフィールドに保存します。 選択した名前 (例: bedrock-metadata
)String False -
ナレッジベースの作成時に、ベクトルインデックス名、ベクトルフィールド名、メタデータ管理マッピングフィールド名に選択した名前を書き留めます。次に [作成] を選択します。
ベクトルインデックスを作成したら、[ナレッジベースの作成] に進むことができます。次の表は、メモした各情報を入力する場所をまとめたものです。
フィールド | ナレッジベース設定 (コンソール) の対応するフィールド | ナレッジベース設定 (API) の対応するフィールド | 説明 |
---|---|---|---|
コレクション ARN | コレクション ARN | collectionARN | ベクトル検索コレクションの Amazon リソースネーム (ARN)。 |
ベクトルインデックス名 | ベクトルインデックス名 | vectorIndexName | ベクトルインデックスの名前。 |
ベクトルフィールド名 | ベクトルフィールド | vectorField | データソースのベクトル埋め込みを保存するフィールドの名前。 |
メタデータ管理 (最初のマッピングフィールド) | テキストフィールド | textField | データソースから未加工のテキストを保存するフィールドの名前。 |
メタデータ管理 (2 番目のマッピングフィールド) | Bedrock が管理するメタデータフィールド | metadataField | Amazon Bedrock が管理するメタデータを保存するフィールドの名前。 |
Amazon OpenSearch Serverless でのベクトルストアの設定に関する詳細なドキュメントについては、「Amazon OpenSearch Service デベロッパーガイド」の「Working with vector search collections」を参照してください。