Amazon OpenSearch Serverless とは - Amazon OpenSearch サービス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon OpenSearch Serverless とは

Amazon OpenSearch Serverless は、Amazon OpenSearch Service のオンデマンドサーバーレス設定です。Serverless は、クラスターのプロビジョニング、設定、チューニングに伴う運用上の複雑さを排除します OpenSearch。これは、 OpenSearch クラスターを自己管理したくない組織や、大規模なクラスターを運用するための専用のリソースや専門知識を持たない組織に適しています。 OpenSearch Serverless を使用すると、基盤となるインフラストラクチャやデータ管理を気にすることなく、大量のデータを簡単に検索および分析できます。

OpenSearch サーバーレスコレクションは、特定のワークロードまたはユースケースをサポートするために連携するインデックスの OpenSearchグループです。コレクションは、手動プロビジョニングを必要とするセルフマネージド OpenSearch クラスターよりも簡単に使用できます。

コレクションには、プロビジョニングされた OpenSearch サービスドメインで使用されるのと同じ種類の大容量、分散型、高可用性のストレージボリュームがありますが、手動設定やチューニングを必要としないため、複雑さが軽減されます。データはコレクション内で転送中に暗号化されます。 OpenSearch Serverless は Dashboards もサポートしています。 OpenSearch Dashboards は、データを分析するための直感的なインターフェイスを提供します。

サーバーレスコレクションは現在、 OpenSearch バージョン 2.0.x を実行しています。新しいバージョンがリリースされると、 OpenSearch Serverless はコレクションを自動的にアップグレードして、新機能、バグ修正、パフォーマンスの向上を利用します。

OpenSearch Serverless のユースケース

OpenSearch Serverless は、主に次の 2 つのユースケースをサポートしています。

  • ログ分析 – ログ分析セグメントは、オペレーションインサイトとユーザーの行動に関するインサイトを得るために、マシン生成による大量の半構造化された時系列データを分析することに重点を置きます。

  • 全文検索 – 全文検索セグメントが、社内ネットワーク内のアプリケーション (コンテンツ管理システム、法的文書) や、e コマースウェブサイトのコンテンツ検索などのインターネット向けアプリケーションを強化します。

コレクションを作成するときは、これらのユースケースのいずれかを選択します。詳細については、「コレクションタイプを選択する」を参照してください。

前提条件

OpenSearch Serverless は OpenSearch 、オープンソーススイートと同じ取り込みおよびクエリAPIオペレーションをサポートしているため、既存のクライアントとアプリケーションを引き続き使用できます。 OpenSearch Serverless を使用するには、クライアントが OpenSearch 2.x と互換性がある必要があります。詳細については、「Amazon OpenSearch Serverless コレクションへのデータの取り込み」を参照してください。

仕組み

従来の OpenSearch クラスターには、インデックス作成オペレーションと検索オペレーションの両方を実行する 1 つのインスタンスセットがあり、インデックスストレージはコンピューティング性能と密接に結合されています。対照的に、 OpenSearch Serverless はインデックス作成 (取り込み) コンポーネントを検索 (クエリ) コンポーネントから分離するクラウドネイティブアーキテクチャを使用します。Amazon S3 はインデックスのプライマリデータストレージです。

この分離されたアーキテクチャでは、検索機能とインデックス作成機能を相互に独立して、さらに S3 のインデックス化されたデータとも無関係にスケーリングできます。また、このアーキテクチャでは、取り込みオペレーションとクエリオペレーションを分離できるため、リソースを競合させることなく同時に実行できます。

コレクションにデータを書き込むと、 OpenSearch Serverless はそれをインデックス作成コンピューティングユニットに分散します。インデックス作成用コンピューティングユニットは、受信データを取り込み、インデックスを S3 に移動します。コレクションデータに対して検索を実行すると、 OpenSearch Serverless はクエリ対象のデータを保持する検索コンピューティングユニットにリクエストをルーティングします。検索コンピューティングユニットは、インデックス化されたデータを S3 から直接ダウンロードし (まだローカルにキャッシュされていない場合)、検索オペレーションを実行し、集計を実行します。

次の図は、この分離されたアーキテクチャを示しています。

Diagram showing indexing and search processes using compute units and Amazon S3 storage.

OpenSearch データインジェスト、検索、クエリのサーバーレスコンピューティング容量は、コンピューティングユニット () OpenSearch で測定されますOCUs。各 OCUは、6 GiB のメモリと対応する仮想 CPU (vCPU) の組み合わせであり、Amazon S3 へのデータ転送でもあります。各 OCUには、120 GiB のインデックスデータ用に十分なホットエフェメラルストレージが含まれています。

最初のコレクションを作成すると、 OpenSearch Serverless OCUsは 2 つをインスタンス化します。1 つはインデックス作成用、もう 1 つは検索用です。高可用性を確保するために、他のアベイラビリティーゾーンでスタンバイノードのセットも起動します。開発およびテストの目的で、コレクションの冗長性を有効にする設定を無効にすることができます。これにより、2 つのスタンバイレプリカが削除され、2 つの のみがインスタンス化されますOCUs。デフォルトでは、冗長アクティブレプリカは有効になっています。つまり、アカウントの最初のコレクションに対して合計 4 つの OCUsがインスタンス化されます。

これらは、コレクションエンドポイントにアクティビティがない場合でもOCUs存在します。後続のすべてのコレクションは、これらの を共有しますOCUs。同じアカウントで追加のコレクションを作成すると、 OpenSearch Serverless は、指定した容量制限に従って、コレクションをサポートするために必要な場合にのみ検索と取り込みOCUsのための追加を追加します。キャパシティーは、コンピューティング使用量の減少に伴ってスケールダウンされます。

これらの の請求方法についてはOCUs、「」を参照してください OpenSearch Serverless の料金

コレクションタイプを選択する

OpenSearch Serverless は、3 つのプライマリコレクションタイプをサポートしています。

[Time series] (時系列) – 運用、セキュリティ、ユーザー行動、およびビジネスに関するインサイトを得るために、マシン生成による大量の半構造化されたデータをリアルタイムで分析することに重点を置いたログ分析セグメント。

[Search] (検索) – 社内ネットワーク内のアプリケーション (コンテンツ管理システム、法的文書) や、e コマースウェブサイト検索やコンテンツ検索などのインターネット向けアプリケーションを強化する全文検索。

[ベクトル検索] – ベクトルデータ管理を簡素化し、機械学習 (ML) によって拡張された検索エクスペリエンスと、チャットボット、パーソナルアシスタント、不正検出などの生成 AI アプリケーションを強化する、ベクトル埋め込みのセマンティック検索。

コレクションを初めて作成するときに、コレクションタイプを選択します。

Three collection type options: Time series, Search, and Vector search for different data use cases.

選択するコレクションタイプは、コレクションに取り込む予定のデータの種類と、そのデータへのクエリ実行方法によって異なります。コレクションの作成後にコレクションタイプを変更することはできません。

コレクションタイプには、次の大きな違いがあります。

  • 検索およびベクトル検索コレクションでは、迅速なクエリ応答時間を確保するために、すべてのデータがホットストレージに保存されます。時系列コレクションでは、ホットストレージとウォームストレージを組み合わせて使用します。この場合、より頻繁にアクセスされるデータのクエリ応答時間を最適化するために、最新のデータがホットストレージに保存されます。

  • 時系列およびベクトル検索コレクションの場合、カスタムドキュメント ID によるインデックス付けや、UPSERT リクエストによる更新はできません。この操作は検索のユースケース専用です。代わりにドキュメント ID を使用して更新できます。詳細については、「サポートされている OpenSearch APIオペレーションとアクセス許可」を参照してください。

  • 検索および時系列コレクションの場合、k-NN タイプのインデックスは使用できません。

OpenSearch Serverless の料金

OpenSearch Serverless では、以下のコンポーネントに対して課金されます。

  • データインジェスト用コンピューティング

  • 検索およびクエリ用コンピューティング

  • ストレージは Amazon S3 に保持されます

OCUs は時間単位で課金され、秒単位の詳細度で請求されます。アカウントステートメントには、データインジェスト用のラベルと検索用のラベルが付いたコンピューティング用のエントリが OCU時間単位で表示されます。また、Amazon S3 に保存されているデータに対しても月単位で請求されます。 OpenSearch Dashboards の使用に対して料金は発生しません。

コレクションを作成し、冗長アクティブレプリカを有効にすると、取り込みには最低 2 OCUs [0.5 OCU x 2]、検索には最低 1 OCU [0.5 OCU x 2] の料金が請求されます。冗長アクティブレプリカを無効にすると、アカウントの最初のコレクションに対して最低 1 OCU [0.5 OCU x 2] の料金が請求されます。後続のすべてのコレクションは、これらの を共有できますOCUs。

OpenSearch Serverless OCUsは、コレクションをサポートするのに必要なコンピューティング能力とストレージOCUに基づいて、1 ずつ追加します。コストを制御するために、 OCUs アカウントの の最大数を設定できます。

注記

一意の を持つコレクション AWS KMS keys は、他のコレクションOCUsと共有できません。

OpenSearch サーバーレスは、ワークロードの変化に対応するために最低限必要なリソースの使用を試みます。プロビジョニングOCUsされる の数はいつでも異なり、正確ではありません。時間の経過とともに、 OpenSearch Serverless が使用するアルゴリズムは、システムの使用量をより最小限に抑えるために改善され続けます。

料金の詳細については、「Amazon OpenSearch サービスの料金」を参照してください。

サポート AWS リージョン

OpenSearch Serverless は、 AWS リージョン その OpenSearch サービスが利用可能な のサブセットで使用できます。サポートされているリージョンのリストについては、「」の「Amazon OpenSearch Service エンドポイントとクォータ」を参照してくださいAWS 全般のリファレンス

制限

OpenSearch Serverless には次の制限があります。

  • 一部の OpenSearch APIオペレーションはサポートされていません。「サポートされている OpenSearch APIオペレーションとアクセス許可」を参照してください。

  • 一部の OpenSearch プラグインはサポートされていません。「サポートされている OpenSearch プラグイン」を参照してください。

  • 現在、マネージド OpenSearch サービスドメインからサーバーレスコレクションにデータを自動的に移行する方法はありません。ドメインからコレクションにデータを再インデックスする必要があります。

  • コレクションへのクロスアカウントアクセスはサポートされていません。他のアカウントからのコレクションを暗号化またはデータアクセスポリシーに含めることはできません。

  • カスタム OpenSearch プラグインはサポートされていません。

  • OpenSearch Serverless コレクションのスナップショットを作成または復元することはできません。

  • クロスリージョン検索およびレプリケーションはサポートされていません。

  • 1 つのアカウントおよびリージョンで使用できるサーバーレスリソースの数には制限があります。OpenSearch 「サーバーレスクォータ」を参照してください。

  • ベクトル検索コレクションのインデックスの更新間隔は約 60 秒です。検索コレクションと時系列コレクションのインデックスの更新間隔は約 10 秒です。

  • シャードの数、間隔の数、更新間隔は変更できず、 OpenSearch サーバーレスによって処理されます。シャーディング戦略はコレクションタイプとトラフィックに基づいています。例えば、時系列コレクションでは、書き込みトラフィックのボトルネックに基づいてプライマリシャードをスケーリングします。

  • 2.1 までの OpenSearch バージョンで利用可能な地理空間機能がサポートされています。