翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ベクトル検索
Amazon OpenSearch Service でのベクトル検索では、従来のキーワードマッチングではなく機械学習埋め込みを使用して意味的に類似したコンテンツを検索できます。ベクトル検索は、データ (テキスト、画像、オーディオなど) を、コンテンツの意味的意味をキャプチャする高次元数値ベクトル (埋め込み) に変換します。検索を実行すると、OpenSearch はクエリのベクトル表現を保存されたベクトルと比較して、最も類似した項目を見つけます。
ベクトル検索には、次の主要なコンポーネントが含まれます。
- ベクトルフィールド
-
OpenSearch は、設定可能なディメンション (最大 16,000) を持つ高密度ベクトルを保存する
knn_vector
フィールドタイプをサポートしています。 - 検索方法
-
-
k-NN (k 最近傍): k の最も類似したベクトルを検索します
-
概算 k-NN: HNSW (Hierarchical Navigable Small World) などのアルゴリズムを使用して、大規模なデータセットをすばやく検索
-
- 距離メトリクス
-
以下を含むさまざまな類似度計算をサポートします。
-
ユークリッド距離
-
コサイン類似度
-
Dot 製品
-
一般的なユースケース
ベクトル検索では、以下の一般的なユースケースがサポートされています。
-
セマンティック検索: 一致するキーワードだけでなく、同様の意味を持つドキュメントを検索する
-
レコメンデーションシステム: 類似製品、コンテンツ、またはユーザーを提案する
-
イメージ検索: 視覚的に似たイメージを検索する
-
異常検出: データパターンの外れ値を特定する
-
RAG (取得拡張生成): 関連するコンテキストで LLM レスポンスを強化する
機械学習との統合
OpenSearch は、以下の機械学習サービスおよびモデルと統合されています。
-
Amazon Bedrock: 基盤モデルを使用して埋め込みを生成する場合
-
Amazon SageMaker AI: カスタム ML モデルデプロイ用
-
Hugging Face モデル: 事前トレーニング済みの埋め込みモデル
-
カスタムモデル: 独自のトレーニング済み埋め込みモデル
ベクトル検索を使用すると、コンテキストと意味を理解する高度な AI を活用したアプリケーションを構築し、従来のテキストマッチング機能をはるかに超えることができます。