Qu'est-ce qu'Amazon OpenSearch Serverless ? - Amazon OpenSearch Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu'est-ce qu'Amazon OpenSearch Serverless ?

Amazon OpenSearch Serverless est une configuration sans serveur à la demande pour Amazon OpenSearch Service. Le mode Serverless élimine les complexités opérationnelles liées au provisionnement, à la configuration et au réglage de vos clusters. OpenSearch C'est une bonne option pour les organisations qui ne souhaitent pas gérer elles-mêmes leurs OpenSearch clusters, ou pour les organisations qui ne disposent pas des ressources ou de l'expertise nécessaires pour exploiter de grands clusters. Avec OpenSearch Serverless, vous pouvez facilement rechercher et analyser un grand volume de données sans avoir à vous soucier de l'infrastructure sous-jacente et de la gestion des données.

Une collection OpenSearch sans serveur est un groupe d' OpenSearchindex qui fonctionnent ensemble pour prendre en charge une charge de travail ou un cas d'utilisation spécifique. Les collections sont plus faciles à utiliser que les OpenSearch clusters autogérés, qui nécessitent un provisionnement manuel.

Les collections disposent du même type de volume de stockage à haute capacité, distribué et hautement disponible que celui utilisé par les domaines de OpenSearch service provisionnés, mais elles simplifient la tâche car elles ne nécessitent pas de configuration ni de réglage manuels. Les données sont cryptées pendant leur transit au sein d'une collection. OpenSearch Serverless prend également en charge OpenSearch les tableaux de bord, qui fournissent une interface intuitive pour analyser les données.

Les collections sans serveur exécutent actuellement la OpenSearch version 2.0.x. Au fur et à mesure que de nouvelles versions sont publiées, OpenSearch Serverless met automatiquement à niveau vos collections pour utiliser les nouvelles fonctionnalités, les corrections de bogues et les améliorations de performances.

Cas d'utilisation du mode OpenSearch Serverless

OpenSearch Serverless prend en charge deux principaux cas d'utilisation :

  • Analyse des journaux : le segment d'analyse des journaux se concentre sur les grands volumes de données de séries temporelles semi-structurées et générées par des machines, afin d'obtenir des informations sur les opérations et le comportement des utilisateurs.

  • Recherche en texte intégral : le segment de recherche en texte intégral alimente les applications de vos réseaux internes (systèmes de gestion de contenu, documents juridiques) et les applications accessibles sur Internet, telles que la recherche de contenu sur les sites web de commerce en ligne.

Lorsque vous créez une collection, vous choisissez l'un de ces cas d'utilisation. Pour plus d’informations, consultez Choix d'un type de collection.

Premiers pas

Pour démarrer avec OpenSearch Serverless, créez une ou plusieurs collections à l'aide de la console de OpenSearch service AWS CLI, du ou de l'un des AWS SDK. Pour consulter un didacticiel qui vous aidera à créer rapidement une collection, veuillez consulter la rubrique Commencer à utiliser Amazon OpenSearch Serverless.

OpenSearch Serverless prend en charge les mêmes opérations d'API d'ingestion et de requête que la suite OpenSearch open source, ce qui vous permet de continuer à utiliser vos clients et applications existants. Vos clients doivent être compatibles avec la OpenSearch version 2.x pour fonctionner avec OpenSearch Serverless. Pour plus d’informations, consultez Ingestion de données dans des collections Amazon OpenSearch Serverless.

Comment ça marche

Les OpenSearch clusters traditionnels possèdent un ensemble unique d'instances qui effectuent à la fois des opérations d'indexation et de recherche, et le stockage d'index est étroitement lié à la capacité de calcul. En revanche, OpenSearch Serverless utilise une architecture native pour le cloud qui sépare les composants d'indexation (ingestion) des composants de recherche (requête), Amazon S3 étant le principal stockage de données pour les index.

Cette architecture découplée vous permet de mettre à l'échelle les fonctions de recherche et d'indexation indépendamment les unes des autres et indépendamment des données indexées dans S3. L'architecture permet également d'isoler les opérations d'ingestion et de requête afin qu'elles puissent s'exécuter simultanément sans conflit de ressources.

Lorsque vous écrivez des données dans une collection, OpenSearch Serverless les distribue aux unités de calcul d'indexation. Les unités de calcul d'indexation ingèrent les données entrantes et déplacent les index vers S3. Lorsque vous effectuez une recherche sur les données de collecte, OpenSearch Serverless achemine les demandes vers les unités de calcul de recherche qui contiennent les données demandées. Les unités de calcul de recherche téléchargent les données indexées directement depuis S3 (si elles ne sont pas déjà mises en cache localement), exécutent des opérations de recherche et effectuent des regroupements.

L'image suivante illustre cette architecture découplée :

OpenSearch La capacité de calcul sans serveur pour l'ingestion, la recherche et l'interrogation des données est mesurée en unités de OpenSearch calcul (OCU). Chaque OCU est une combinaison de 6 Gio de mémoire et du processeur virtuel (vCPU) correspondant et crée un transfert de données vers Amazon S3. Chaque OCU comprend suffisamment de stockage éphémère à chaud pour 120 Gio de données d'index.

Lorsque vous créez votre première collection, OpenSearch Serverless instancie deux OCU, l'un pour l'indexation et l'autre pour la recherche. Afin de garantir une haute disponibilité, il lance également un ensemble de nœuds de secours dans une autre zone de disponibilité. À des fins de développement et de test, vous pouvez désactiver le paramètre Activer la redondance pour une collection, ce qui élimine les deux répliques de secours et instancie uniquement deux OCU. Par défaut, les répliques actives redondantes sont activées, ce qui signifie qu'un total de quatre OCU sont instanciés pour la première collection d'un compte.

Ces OCU existent même en l'absence d'activité sur les points de terminaison de la collection. Toutes les collections suivantes partagent ces OCU. Lorsque vous créez des collections supplémentaires dans le même compte, OpenSearch Serverless ajoute uniquement des OCU supplémentaires pour la recherche et l'ingestion selon les besoins pour prendre en charge les collections, conformément aux limites de capacité que vous spécifiez. La capacité diminue à mesure que votre utilisation des ressources informatiques diminue.

Pour plus d'informations sur la facturation de ces OCU, veuillez consulter la rubrique Tarification du mode OpenSearch Serverless.

Choix d'un type de collection

OpenSearch Serverless prend en charge trois types de collecte principaux :

Séries temporelles : segment d'analyse des journaux qui se concentre sur l'analyse en temps réel de grands volumes de données semi-structurées et générées par des machines, à des fins opérationnelles, de sécurité, de comportement des utilisateurs et d'informations métier.

Recherche : recherche en texte intégral qui alimente les applications de vos réseaux internes (systèmes de gestion de contenu, documents juridiques) et les applications accessibles sur Internet, telles que la recherche sur les sites web de commerce en ligne et la recherche de contenu.

Recherche vectorielle : recherche sémantique sur des intégrations vectorielles qui simplifie la gestion des données vectorielles et optimise les expériences de recherche augmentées par apprentissage automatique (ML) et les applications d'IA génératives, telles que les chatbots, les assistants personnels et la détection des fraudes.

Vous choisissez un type de collection lorsque vous créez une collection pour la première fois :

Le type de collection que vous choisissez dépend du type de données que vous prévoyez d'intégrer à la collection et de la manière dont vous allez les interroger. Vous ne pouvez pas modifier le type de la collection après l'avoir créée.

Les types de collection présentent les différences notables suivantes :

  • Pour les collections de recherche et de recherche vectorielle, toutes les données sont stockées dans un espace de stockage à chaud afin de garantir des temps de réponse rapides aux requêtes. Les collections de séries temporelles utilisent une combinaison de stockage à chaud et tiède, les données les plus récentes étant conservées dans un stockage hot afin d'optimiser les temps de réponse aux requêtes pour les données les plus fréquemment consultées.

  • Pour les séries chronologiques et les collections de recherche vectorielle, vous ne pouvez pas indexer par identifiant de document personnalisé ni mettre à jour par des requêtes upsert. Cette opération est réservée aux cas d'utilisation de recherche. Vous pouvez plutôt effectuer une mise à jour par numéro de document. Pour plus d’informations, consultez Opérations et autorisations d' OpenSearch API prises en charge.

  • Pour les recherches et les collections de séries chronologiques, vous ne pouvez pas utiliser d'index de type K-nn.

Tarification du mode OpenSearch Serverless

Dans OpenSearch Serverless, les composants suivants vous sont facturés :

  • Calcul d'ingestion de données

  • Calcul de recherche et de requêtes

  • Stockage conservé dans Amazon S3

Les OCU sont facturées sur une base horaire, à la seconde. Votre relevé de compte comporte une entrée pour le calcul en heures d'OCU avec un libellé pour l'ingestion de données et un libellé pour la recherche. Les données stockées dans Amazon S3 vous sont également facturées chaque mois. L'utilisation des OpenSearch tableaux de bord ne vous est pas facturée.

Un minimum de 2 OCU [0,5 OCU x 2] vous est facturé pour l'ingestion et 1 OCU [0,5 OCU x 2] pour la recherche lorsque vous créez une collection et activez des répliques actives redondantes. Un minimum de 1 OCU [0,5 OCU x 2] vous est facturé pour la première collection de votre compte si vous désactivez les répliques actives redondantes. Toutes les collections suivantes peuvent partager ces OCU.

OpenSearch Serverless ajoute des OCU supplémentaires par incréments de 1 OCU en fonction de la puissance de calcul et du stockage nécessaires pour prendre en charge vos collections. Vous pouvez configurer un nombre maximal d'OCU pour votre compte afin de contrôler les coûts.

Note

Les collections dont l'objectif est unique ne AWS KMS keys peuvent pas être partagées avec d'autres collections.

OpenSearch Serverless tente d'utiliser les ressources minimales requises pour tenir compte de l'évolution des charges de travail. Le nombre d'OCU provisionnés à un moment donné peut varier et n'est pas exact. Au fil du temps, l'algorithme utilisé par OpenSearch Serverless continuera de s'améliorer afin de mieux minimiser l'utilisation du système.

Pour en savoir plus sur les tarifs, consultez les tarifs d'Amazon OpenSearch Service.

Soutenu Régions AWS

OpenSearch Serverless est disponible dans un sous-ensemble de Régions AWS ce OpenSearch service disponible dans. Pour obtenir la liste des régions prises en charge, consultez la section Points OpenSearch de terminaison et quotas Amazon Service dans le Références générales AWS.

Limites

OpenSearch Le mode Serverless présente les limites suivantes :

  • Certaines opérations OpenSearch d'API ne sont pas prises en charge. veuillez consulter Opérations et autorisations d' OpenSearch API prises en charge.

  • Certains OpenSearch plugins ne sont pas pris en charge. veuillez consulter OpenSearch Plugins pris en charge.

  • Il n'existe actuellement aucun moyen de migrer automatiquement vos données d'un domaine de OpenSearch service géré vers une collection sans serveur. Vous devez réindexer vos données d'un domaine vers une collection.

  • L'accès intercompte aux collections n'est pas pris en charge. Vous ne pouvez pas inclure les collections provenant d'autres comptes dans vos stratégies de chiffrement ou d'accès aux données.

  • Les OpenSearch plugins personnalisés ne sont pas pris en charge.

  • Vous ne pouvez pas prendre ou restaurer des instantanés de collections OpenSearch sans serveur.

  • La recherche et la réplication entre régions ne sont pas prises en charge.

  • Le nombre de ressources sans serveur que vous pouvez avoir dans un seul compte et une seule région est limité. Voir Quotas OpenSearch sans serveur.

  • L'intervalle d'actualisation des index dans les collections de recherche vectorielle est d'environ 60 secondes. L'intervalle d'actualisation des index dans les recherches et les collections de séries chronologiques est d'environ 10 secondes.

  • Le nombre de partitions, le nombre d'intervalles et l'intervalle d'actualisation ne sont pas modifiables et sont gérés par OpenSearch Serverless. La stratégie de partitionnement est basée sur le type de collecte et le trafic. Par exemple, une collection de séries chronologiques redimensionne les partitions primaires en fonction des goulots d'étranglement du trafic d'écriture.

  • Les fonctionnalités géospatiales disponibles sur OpenSearch les versions jusqu'à 2.1 sont prises en charge.

Comparaison entre le OpenSearch service et le mode OpenSearch sans serveur

Dans OpenSearch Serverless, certains concepts et fonctionnalités sont différents de leurs fonctionnalités correspondantes pour un domaine de OpenSearch service provisionné. Par exemple, une différence importante est que OpenSearch Serverless n'a pas le concept de cluster ou de nœud.

Le tableau suivant décrit en quoi les fonctionnalités et concepts importants de OpenSearch Serverless diffèrent des fonctionnalités équivalentes dans un domaine de OpenSearch service provisionné.

Fonctionnalité OpenSearch Service OpenSearch Sans serveur

Domaines vs. collections

Les index sont conservés dans des domaines, qui sont des clusters pré-provisionnés OpenSearch .

Pour plus d’informations, consultez Création et gestion de domaines Amazon OpenSearch Service.

Les index sont conservés dans des collections, qui sont des regroupements logiques d'index qui représentent une charge de travail ou un cas d'utilisation spécifique.

Pour plus d’informations, consultez Création, mise en vente et suppression de collections Amazon OpenSearch Serverless.

Types de nœuds et gestion de la capacité

Vous créez un cluster avec des types de nœuds qui répondent à vos spécifications en matière de coûts et de performances. Vous devez calculer vos besoins en stockage et choisir un type d'instance pour votre domaine.

Pour plus d’informations, consultez Dimensionnement des domaines Amazon OpenSearch Service.

OpenSearch Serverless adapte et fournit automatiquement des unités de calcul supplémentaires pour votre compte en fonction de l'utilisation de votre capacité.

Pour plus d’informations, consultez Gestion des limites de capacité pour Amazon OpenSearch Serverless.

Facturation

Vous payez chaque heure d'utilisation d'une instance EC2 et selon la taille cumulée des volumes de stockage EBS associés à vos instances.

Pour plus d’informations, consultez Tarification d'Amazon OpenSearch Service.

Vous êtes facturé en heures d'OCU pour le calcul d'ingestion de données, le calcul de recherche et des requêtes, et le stockage conservé dans S3.

Pour plus d’informations, consultez Tarification du mode OpenSearch Serverless.

Chiffrement

Le chiffrement au repos est facultatif pour les domaines.

Pour plus d’informations, consultez Chiffrement des données au repos pour Amazon OpenSearch Service.

Le chiffrement au repos est requis pour les collections.

Pour plus d’informations, consultez Chiffrement dans Amazon OpenSearch Serverless.

Contrôle d'accès aux données

L'accès aux données au sein des domaines est déterminé par des politiques IAM et un contrôle d'accès précis.

L'accès aux données au sein des collections est déterminé par des stratégies d'accès aux données.

OpenSearchOpérations prises en charge

OpenSearch Le service prend en charge un sous-ensemble de toutes les opérations d' OpenSearch API.

Pour plus d’informations, consultez Opérations prises en charge dans Amazon OpenSearch Service.

OpenSearch Serverless prend en charge un sous-ensemble différent d'opérations d' OpenSearch API.

Pour plus d’informations, consultez Opérations et plug-ins pris en charge dans Amazon OpenSearch Serverless.

Connexion aux tableaux de bord

Connectez-vous à l'aide d'un nom d'utilisateur et d'un mot de passe.

Pour plus d’informations, consultez Accès aux OpenSearch tableaux de bord en tant qu'utilisateur principal.

Si vous êtes connecté à la AWS console et que vous accédez à l'URL de votre tableau de bord, vous vous connecterez automatiquement.

Pour plus d’informations, consultez Accès aux OpenSearch tableaux de bord.

API

Interagissez par programmation avec le OpenSearch service à l'aide des opérations de l'API du OpenSearch service.

Interagissez par programmation avec OpenSearch Serverless à l'aide des opérations de l'API OpenSearch Serverless.

Accès réseau

Les paramètres réseau d'un domaine s'appliquent au point de terminaison du domaine ainsi qu'au point de terminaison OpenSearch des tableaux de bord. L'accès réseau pour ces deux points de terminaison est étroitement lié.

Les paramètres réseau du point de terminaison du domaine et du point de terminaison OpenSearch des tableaux de bord sont découplés. Vous pouvez choisir de ne pas configurer l'accès réseau pour les OpenSearch tableaux de bord.

Pour plus d’informations, consultez Accès au réseau pour Amazon OpenSearch Serverless.

Signature des requêtes

Utilisez les clients REST de OpenSearch haut et de bas niveau pour signer les demandes. Spécifiez le nom du service sous la forme es.

À l'heure actuelle, OpenSearch Serverless prend en charge un sous-ensemble de clients pris en charge par OpenSearch Service.

Lorsque vous signez des requêtes, spécifiez le nom du service sous la forme aoss. L'en-tête x-amz-content-sha256 est obligatoire. Pour plus d’informations, consultez Signature des demandes HTTP avec d'autres clients.

OpenSearch mises à niveau de version

Vous mettez à niveau manuellement vos domaines au fur et à mesure que de nouvelles versions de sont OpenSearch disponibles. Vous êtes responsable de vous assurer que votre domaine répond aux exigences de mise à niveau et que vous avez pris en compte toutes les modifications majeures.

OpenSearch Serverless met automatiquement à niveau vos collections vers les nouvelles OpenSearch versions. Les mises à niveau ne se produisent pas nécessairement dès qu'une nouvelle version est disponible.

Mises à jour du logiciel de service

Vous appliquez manuellement les mises à jour du logiciel de service à votre domaine dès qu'elles sont disponibles.

OpenSearch Serverless met automatiquement à jour vos collections pour utiliser les dernières corrections de bogues, fonctionnalités et améliorations de performances.

Accès VPC

Vous pouvez allouer votre domaine au sein d'un VPC.

Vous pouvez également créer des points de terminaison OpenSearch VPC supplémentaires gérés par le service pour accéder au domaine.

Vous créez un ou plusieurs points de OpenSearch terminaison VPC gérés sans serveur pour votre compte. Vous incluez ensuite ces points de terminaison dans les stratégies réseau.

Authentification SAML

Vous activez l'authentification SAML par domaine.

Pour plus d’informations, consultez Authentification SAML pour les tableaux de bord OpenSearch .

Vous configurez un ou plusieurs fournisseurs SAML au niveau du compte, puis vous incluez les ID d'utilisateur et de groupe associés dans les stratégies d'accès aux données.

Pour plus d’informations, consultez Authentification SAML pour Amazon Serverless OpenSearch .

protocole TLS (Transport Layer Security) OpenSearch Le service prend en charge le protocole TLS 1.2, mais il est recommandé d'utiliser le protocole TLS 1.3. OpenSearch Serverless prend en charge le protocole TLS 1.2, mais il est recommandé d'utiliser le protocole TLS 1.3.