ベクトルデータベースオプション - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ベクトルデータベースオプション

AWS は、生成 AI アプリケーションのさまざまなユースケースと要件をサポートするさまざまなベクトルデータベースソリューションを提供します。これらのオプションは、個々のデータベースサービスとマネージドサービスサービスに広く分類でき、それぞれに異なる特性と利点があります。これらのオプションを理解することは、最適なパフォーマンス、スケーラビリティ、コスト効率を維持しながら、ベクトル検索機能を効果的に実装することを検討している組織にとって不可欠です。

ベクトルデータベースソリューションの詳細については、以下のセクションを参照してください。

個々のベクトルデータベースオプション

の個々のベクトルデータベースオプション AWS には、Amazon Kendra、Amazon OpenSearch Service、および を使用した Amazon RDS for PostgreSQL が含まれますpgvector。(オープンソースの拡張機能である は、機械学習 (ML) で生成されたベクトル埋め込みを保存および検索する機能pgvectorを追加します。) これらのソリューションは、ベクトル検索にさまざまなアプローチを提供し、組織が既存のインフラストラクチャ、技術要件、特定のユースケースに基づいて選択できるようにします。

Amazon Kendra

Amazon Kendra は、自然言語処理と高度な機械学習アルゴリズムを使用して、データからの検索質問に対する特定の回答を返すエンタープライズグレードのインテリジェント検索サービスです。Amazon Kendra は検索機能の実装を簡素化し、生成 AI アプリケーションのための効果的なバックエンドソリューションです。

Amazon Kendra のその他の主要な機能は次のとおりです。

  • 40 を超えるデータソースへのネイティブ接続

  • 組み込みのデータ準備機能

  • 技術的な深い専門知識を必要としない高速セットアップ

Amazon Kendra の利点は次のとおりです。

詳細については、「Amazon Kendra デベロッパーガイド」の「Amazon Kendra の利点」を参照してください。

Amazon OpenSearch Service

Amazon OpenSearch Service は、 で OpenSearch Service クラスターをデプロイ、運用、スケーリングするのに役立つマネージドサービスです AWS クラウド。

OpenSearch Service の主な機能は次のとおりです。

  • オープンソースの検索および分析エンジン

  • 分散アーキテクチャ

  • リアルタイムデータ処理

OpenSearch Service を使用する利点には、次のようなものがあります。

  • 水平スケーラビリティ

  • RESTful API のサポート

  • 構造化データと非構造化データを処理する

  • リアルタイムデータ分析

  • さまざまなデプロイサイズに適しています

詳細については、OpenSearch Service デベロッパーガイドの「Amazon OpenSearch Service の機能」を参照してください。

を使用した Amazon RDS for PostgreSQL pgvector

Amazon RDS for PostgreSQL と は、 AWS マネージドリレーショナルデータベースサービスと PostgreSQL のベクトル処理拡張機能pgvectorを組み合わせます。この組み合わせにより、組織は Amazon RDS を維持しながら高次元ベクトルを保存およびクエリできます。このソリューションは、データベースインフラストラクチャを管理するオーバーヘッドなしでリアルタイムベクトル操作を必要とする生成 AI アプリケーションに特に適しています。

を使用した Amazon RDS for PostgreSQL の主な利点pgvectorは次のとおりです。

  • 高可用性

  • 自動フェイルオーバー

  • コスト効率 (pay-per-use制)

  • 組み込みモニタリング

  • リアルタイムベクトルデータ統合

詳細については、「Amazon Relational Database Service ユーザーガイド」の「Amazon RDS の利点」を参照してください。 Amazon Relational Database Service

マネージドサービスオプション

Amazon Bedrock ナレッジベースは、ベクトルデータベースの実装に対する AWS フルマネージド型のアプローチを表します。このサービスのストレージオプションの柔軟性と自動管理機能は、複雑なインフラストラクチャを管理せずに RAG を実装しようとしている組織にとって特に有益です。

Amazon Bedrock ナレッジベースを使用すると、RAG を使用して基盤モデルを強化するナレッジベースを作成、保守、クエリできます。このサービスは、データの取り込み、ベクトル化、取得パイプライン全体を管理することで、RAG を実装する複雑なプロセスを簡素化します。

Amazon Bedrock ナレッジベースの主な利点は次のとおりです。

データ処理の簡素化

  • 自動データ取り込みとチャンキング

  • 複数のファイル形式からの組み込みテキスト抽出

  • マネージドベクトル埋め込みの生成

  • メタデータの自動抽出とインデックス作成

合理化された RAG 実装

  • 事前設定された取り出し戦略

  • 自動コンテキストウィンドウの最適化

  • 組み込みの関連性チューニング

  • すぐに使用できるセマンティック検索機能

セキュリティとガバナンス

  • 統合 AWS Identity and Access Management (IAM) コントロール

  • 保管中および転送中のデータ暗号化

  • VPC サポート

  • によるログ記録の監査 AWS CloudTrail

Amazon Bedrock ナレッジベースは、複数のベクトルストアオプションをサポートしています。次のリストは、各オプションの主な機能の概要を示しています。

  • を使用した Amazon Aurora PostgreSQL pgvector

    • PostgreSQL 互換ベクトルストレージ

    • 既存の Aurora データベースとの統合

    • 小規模なデプロイ向けの費用対効果

    • ハイブリッド構造化データと非構造化データに適しています

  • Amazon Neptune Analytics

    • グラフベースのベクトル検索

    • 関係データをベクトルと組み合わせる

    • 接続されたデータのユースケースに最適

    • 高度なクエリ機能

  • Amazon OpenSearch Serverless

    • フルマネージド型のサーバーレスエクスペリエンス

    • ワークロードに基づく自動スケーリング

    • 組み込み k-NN 機能

    • さまざまなワークロードに対するコスト効率

  • Pinecone

    • 専用ベクトルデータベース

    • 大規模なハイパフォーマンス

    • 高度な類似度検索機能

    • Amazon Bedrock コンソールで管理

  • Redis エンタープライズクラウド

    • インメモリベクトル検索機能

    • 低レイテンシーのパフォーマンス

    • リアルタイムベクトル検索

    • 統合されたキャッシュ機能

Amazon Bedrock ナレッジベースでサポートされているベクトルストアを選択するときは、各オプションについて次の主要な特性を考慮してください。

  • Aurora PostgreSQL – ベクトル機能を備えたリレーショナルデータ

  • Neptune Analytics – グラフベースのナレッジ表現

  • OpenSearch Service – 検索と分析の焦点

  • Pinecone – 純粋なベクトル検索パフォーマンス

  • Redis エンタープライズクラウド — リアルタイムかつ低レイテンシーのニーズ

各実装には、以下の固有の利点があります。

  • Aurora PostgreSQL – 従来の SQL 機能とベクトル機能の両方を必要とするアプリケーションに最適です

  • Neptune Analytics – 複雑な関係ベースのクエリやナレッジグラフに最適です

  • OpenSearch Service – 全文検索と分析に強い

  • Pinecone – 純粋なベクトルオペレーション用に最適化

  • Redis Enterprise Cloud – リアルタイムアプリケーションに最適

RAG ソリューションのベクトルストアを選択するときに考慮すべき重要なポイントを以下に示します。

  • スケーラビリティ – 大規模で成長するデータセットを効率的に処理できます。

  • クエリパフォーマンス — 最も近くにある高速で効率的な検索機能。

  • データインジェスト – 既存のデータモデルの要件。さまざまなデータ形式と取り込みの容易さをサポートします。

  • フィルタリングとランキング — 取得した結果の高度なフィルタリングとランキングメカニズム。

  • 統合 — APIs またはプロトコルによる他のシステムやツールとのシームレスな統合。

  • 永続性と耐久性 – 適切な永続性と耐久性のオプション (メモリ内またはディスクベース)。

  • 同時実行性と整合性 — 同時アクセスとデータ整合性の効率的な処理。

  • ライセンスとコスト – ライセンスモデル、前払いコストと継続的なコスト、ベンダーロックインの評価。

  • コミュニティとサポート – 生き生きとしたコミュニティと包括的なドキュメント。

  • セキュリティとコンプライアンス – 必要なセキュリティとコンプライアンス要件の遵守。