¿Qué es Amazon OpenSearch Serverless? - OpenSearch Servicio Amazon

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

¿Qué es Amazon OpenSearch Serverless?

Amazon OpenSearch Serverless es una configuración sin servidor bajo demanda para Amazon OpenSearch Service. Serverless elimina las complejidades operativas del aprovisionamiento, la configuración y el ajuste de los clústeres. OpenSearch Es una buena opción para las organizaciones que no desean administrar sus OpenSearch clústeres por sí mismas o para las organizaciones que no cuentan con los recursos o la experiencia dedicados para operar clústeres de gran tamaño. Con OpenSearch Serverless, puede buscar y analizar fácilmente un gran volumen de datos sin tener que preocuparse por la infraestructura subyacente ni por la administración de datos.

Una colección OpenSearch sin servidor es un grupo de OpenSearch índices que funcionan en conjunto para respaldar una carga de trabajo o un caso de uso específicos. Las colecciones son más fáciles de usar que los OpenSearch clústeres autogestionados, que requieren un aprovisionamiento manual.

Las colecciones tienen el mismo tipo de volumen de almacenamiento de alta capacidad, distribuido y de alta disponibilidad que utilizan los dominios de OpenSearch servicio aprovisionados, pero eliminan la complejidad porque no requieren configuración ni ajustes manuales. Los datos se cifran en tránsito dentro de una colección. OpenSearch Serverless también es compatible con los OpenSearch paneles de control, que proporcionan una interfaz intuitiva para analizar los datos.

Las colecciones sin servidor funcionan OpenSearch actualmente con la versión 2.0.x. A medida que se publiquen nuevas versiones, OpenSearch Serverless actualizará automáticamente sus colecciones para incluir nuevas funciones, correcciones de errores y mejoras de rendimiento.

Casos de uso de OpenSearch Serverless

OpenSearch Serverless admite dos casos de uso principales:

  • Análisis de registros: el segmento de análisis de registros se centra en analizar grandes volúmenes de datos de series temporales semiestructurados y generados por máquinas para obtener información operativa y sobre el comportamiento de los usuarios.

  • Búsqueda de texto completo: el segmento de búsqueda de texto completo potencia las aplicaciones de sus redes internas (sistemas de administración de contenido, documentos legales) y las aplicaciones orientadas a Internet, como la búsqueda de contenido de sitios web de comercio electrónico.

Al crear una colección, debe elegir uno de estos casos de uso. Para obtener más información, consulte Elección de un tipo de colección.

Introducción

Para empezar a usar OpenSearch Serverless, cree una o más colecciones mediante la consola de OpenSearch servicio AWS CLI, el o uno de los AWS SDK. Para ver un tutorial para poner en marcha una colección de forma rápida, consulte Introducción a Amazon OpenSearch Serverless.

OpenSearch Serverless admite las mismas operaciones de API de ingesta y consulta que la suite de código OpenSearch abierto, por lo que puede seguir utilizando sus clientes y aplicaciones actuales. Sus clientes deben ser compatibles con la versión OpenSearch 2.x para poder funcionar con Serverless. OpenSearch Para obtener más información, consulte Ingerir datos en colecciones de Amazon OpenSearch Serverless.

Funcionamiento

OpenSearch Los clústeres tradicionales tienen un único conjunto de instancias que realizan operaciones de indexación y búsqueda, y el almacenamiento de índices está estrechamente relacionado con la capacidad de procesamiento. Por el contrario, OpenSearch Serverless utiliza una arquitectura nativa de la nube que separa los componentes de indexación (ingesta) de los componentes de búsqueda (consulta), con Amazon S3 como almacenamiento de datos principal para los índices.

Esta arquitectura desacoplada permite escalar las funciones de búsqueda e indexación de forma independiente entre ellas y de los datos indexados en S3. La arquitectura también proporciona aislamiento para las operaciones de ingesta y consulta, de modo que puedan ejecutarse de forma simultánea sin contención de recursos.

Cuando escribe datos en una colección, OpenSearch Serverless los distribuye a las unidades informáticas de indexación. Las unidades de computación de indexación ingieren los datos entrantes y mueven los índices a S3. Al realizar una búsqueda en los datos de la recopilación, OpenSearch Serverless dirige las solicitudes a las unidades de cálculo de búsqueda que contienen los datos que se están consultando. Las unidades de computación de búsqueda descargan los datos indexados de forma directa desde S3 (si aún no están almacenados en la memoria caché local), ejecutan operaciones de búsqueda y realizan agregaciones.

La siguiente imagen ilustra esta arquitectura desacoplada:

OpenSearch La capacidad informática sin servidor para la ingesta, búsqueda y consulta de datos se mide en unidades de OpenSearch cálculo (OCU). Cada OCU es una combinación de 6 GiB de memoria y la CPU virtual (vCPU) correspondiente, así como la transferencia de datos a Amazon S3. Cada OCU incluye suficiente almacenamiento efímero en caliente para 120 GiB de datos de índice.

Al crear la primera colección, OpenSearch Serverless crea una instancia de dos OCU: uno para la indexación y otro para la búsqueda. Para garantizar la alta disponibilidad, también lanza un conjunto de nodos en espera en otra zona de disponibilidad. Para fines de desarrollo y pruebas, puede deshabilitar la configuración Habilitar redundancia para una colección, lo que elimina las dos réplicas en espera y solo crea instancias de dos OCU. De forma predeterminada, las réplicas activas redundantes están habilitadas, lo que significa que se crean instancias para un total de cuatro OCU para la primera colección de una cuenta.

Estas OCU existen incluso cuando no hay actividad en ningún punto de conexión de la colección. Todas las colecciones posteriores comparten estas OCU. Al crear colecciones adicionales en la misma cuenta, OpenSearch Serverless solo agrega OCU adicionales para buscar e ingerir según sea necesario para respaldar las colecciones, de acuerdo con los límites de capacidad que especifique. La capacidad se reduce a medida que disminuye el uso de la computación.

Para obtener más información sobre cómo se facturan estas OCU, consulte Precios de Serverless OpenSearch .

Elección de un tipo de colección

OpenSearch Serverless admite tres tipos de recopilación principales:

Series temporales: el segmento de análisis de registros que se centra en analizar grandes volúmenes de datos semiestructurados generados por máquinas en tiempo real para obtener información operativa, de seguridad, del comportamiento de los usuarios y empresarial.

Búsqueda: búsqueda de texto completo que potencia las aplicaciones de sus redes internas (sistemas de administración de contenido, documentos legales) y las aplicaciones orientadas a Internet, como la búsqueda en sitios web de comercio electrónico y la búsqueda de contenido.

Búsqueda vectorial: búsqueda semántica en incrustaciones vectoriales que simplifica la gestión de datos vectoriales y potencia las experiencias de búsqueda aumentada de machine learning (ML) y las aplicaciones de IA generativa, como chatbots, asistentes personales y detección de fraudes.

El tipo de colección se elige cuando se crea una colección por primera vez:

El tipo de colección que elija dependerá del tipo de datos que piensa incorporar a la colección y de cómo piensa consultarlos. No puede cambiar el tipo de colección después de crearla.

Los tipos de colecciones presentan las siguientes diferencias notables:

  • En el caso de las colecciones de búsqueda y de búsqueda vectorial, todos los datos se almacenan en un almacenamiento en caliente para garantizar tiempos de respuesta rápidos a las consultas. Las colecciones de series temporales utilizan una combinación de almacenamiento en caliente y templado, donde los datos más recientes se guardan en un almacenamiento en caliente para optimizar los tiempos de respuesta a las consultas para los datos a los que se accede con más frecuencia.

  • En el caso de las colecciones de series temporales y de búsqueda vectorial, no puede indexar por identificador de documento personalizado ni actualizarlas mediante solicitudes indirectas. Esta operación se reserva para los casos de uso de búsqueda. En su lugar, puede actualizar por ID de documento. Para obtener más información, consulte Operaciones y permisos de OpenSearch API compatibles.

  • Para las recopilaciones de series temporales y de búsqueda, no puede utilizar índices de tipo k-NN.

Precios de Serverless OpenSearch

En OpenSearch Serverless, se cobran los siguientes componentes:

  • Computación de la ingesta de datos

  • Computación de búsquedas y consultas

  • Almacenamiento retenido en Amazon S3

Las OCU se facturan por hora, con un grado de detalle por segundo. En su estado de cuenta, aparece una entrada para la computación en horas de OCU con una etiqueta para la ingesta de datos y otra para la búsqueda. También se cobra de manera mensual por los datos almacenados en Amazon S3. No se le cobrará por usar los OpenSearch paneles de control.

Cuando crea una colección y habilita las réplicas activas redundantes, se le facturará un mínimo de 2 OCU [0,5 OCU x 2] por la ingestión y 1 OCU [0,5 OCU x 2] por la búsqueda. Si deshabilita las réplicas activas redundantes, se le facturará un mínimo de 1 OCU [0,5 OCU x 2] para la primera colección de su cuenta. Todas las colecciones posteriores pueden compartir esas OCU.

OpenSearch Serverless agrega OCU adicionales en incrementos de 1 OCU en función de la potencia de cómputo y el almacenamiento necesarios para respaldar sus colecciones. Puede configurar un número máximo de OCU para su cuenta con el fin de controlar los costos.

nota

Las colecciones con OCU únicas no AWS KMS keys pueden compartirse con otras colecciones.

OpenSearch Serverless intenta utilizar los recursos mínimos necesarios para tener en cuenta los cambios en las cargas de trabajo. La cantidad de OCU aprovisionadas en un momento dado puede variar y no es exacta. Con el tiempo, el algoritmo que utiliza OpenSearch Serverless seguirá mejorando para minimizar mejor el uso del sistema.

Para obtener información completa sobre los precios, consulta los precios OpenSearch de Amazon Service.

Soportado Regiones de AWS

OpenSearch Serverless está disponible en un subconjunto de Regiones de AWS ese OpenSearch servicio en el que está disponible. Para ver una lista de las regiones admitidas, consulta los puntos de conexión y las cuotas de Amazon OpenSearch Service en. Referencia general de AWS

Limitaciones

OpenSearch Serverless tiene las siguientes limitaciones:

  • Algunas operaciones OpenSearch de la API no son compatibles. Consulte Operaciones y permisos de OpenSearch API compatibles.

  • Algunos OpenSearch complementos no son compatibles. Consulte OpenSearch Plugins compatibles.

  • Actualmente, no hay forma de migrar automáticamente los datos de un dominio de OpenSearch servicio gestionado a una colección sin servidor. Debe volver a indexar los datos desde un dominio a una colección.

  • No se admiten el acceso entre cuentas a las colecciones. No puede incluir colecciones de otras cuentas en las políticas de cifrado o de acceso a los datos.

  • No se admiten los OpenSearch complementos personalizados.

  • No puedes tomar ni restaurar instantáneas de colecciones OpenSearch sin servidor.

  • No se admiten la búsqueda y la replicación entre regiones.

  • Hay límites para la cantidad de recursos sin servidor que puede tener en una sola cuenta y región. Consulte Cuotas OpenSearch sin servidor.

  • El intervalo de actualización de los índices de las colecciones de búsquedas vectoriales es de aproximadamente 60 segundos. El intervalo de actualización de los índices de las colecciones de búsquedas y series temporales es de aproximadamente 10 segundos.

  • El número de fragmentos, el número de intervalos y el intervalo de actualización no se pueden modificar y son gestionados por Serverless. OpenSearch La estrategia de partición se basa en el tipo de colección y el tráfico. Por ejemplo, una colección de series temporales escala las particiones principales en función de los cuellos de botella del tráfico de escritura.

  • Se admiten las funciones geoespaciales disponibles en OpenSearch las versiones anteriores a la 2.1.

Comparación entre OpenSearch servicio y sin servidor OpenSearch

En OpenSearch Serverless, algunos conceptos y características son diferentes de su característica correspondiente para un dominio de servicio aprovisionado OpenSearch . Por ejemplo, una diferencia importante es que OpenSearch Serverless no tiene el concepto de clúster o nodo.

En la siguiente tabla se describe en qué se diferencian las funciones y los conceptos importantes de OpenSearch Serverless de la función equivalente de un dominio de servicio aprovisionado OpenSearch .

Característica OpenSearch Servicio OpenSearch Sin servidor

Dominios frente a colecciones

Los índices se guardan en dominios, que son clústeres aprovisionados previamente OpenSearch .

Para obtener más información, consulte Creación y administración de dominios OpenSearch de Amazon Service.

Los índices se encuentran en colecciones, que son agrupaciones lógicas de índices que representan una carga de trabajo o un caso de uso específicos.

Para obtener más información, consulte Crear, publicar y eliminar colecciones de Amazon OpenSearch Serverless.

Tipos de nodos y administración de la capacidad

Crea un clúster con tipos de nodos que cumplen con sus especificaciones de coste y rendimiento. Debe calcular sus propios requisitos de almacenamiento y elegir un tipo de instancia para su dominio.

Para obtener más información, consulte Dimensionamiento de los dominios de Amazon OpenSearch Service.

OpenSearch Serverless escala y aprovisiona automáticamente unidades de cómputo adicionales para su cuenta en función del uso de la capacidad.

Para obtener más información, consulte Administración de los límites de capacidad de Amazon OpenSearch Serverless.

Facturación

Paga por cada hora de uso de una instancia EC2 y por el tamaño acumulado de cualquier volumen de almacenamiento de EBS adjunto a sus instancias.

Para obtener más información, consulte Precios de Amazon OpenSearch Service.

Se le cobrará en horas de OCU por la computación para la ingesta de datos, la computación para las búsquedas y las consultas y el almacenamiento retenido en S3.

Para obtener más información, consulte Precios de Serverless OpenSearch .

Cifrado

El cifrado en reposo es opcional para los dominios.

Para obtener más información, consulte Cifrado de datos en reposo para Amazon OpenSearch Service.

El cifrado en reposo es obligatorio para las colecciones.

Para obtener más información, consulte Cifrado en Amazon OpenSearch Serverless.

Control de acceso a los datos

El acceso a los datos dentro de los dominios se determina mediante políticas de IAM y un control de acceso detallado.

El acceso a los datos dentro de las colecciones se determina mediante las políticas de acceso a los datos.

Operaciones compatibles OpenSearch

OpenSearch El servicio admite un subconjunto de todas las operaciones de la OpenSearch API.

Para obtener más información, consulte Operaciones compatibles en Amazon OpenSearch Service.

OpenSearch Serverless admite un subconjunto diferente de operaciones de OpenSearch API.

Para obtener más información, consulte Operaciones y complementos compatibles en Amazon OpenSearch Serverless.

Inicio de sesión en Dashboards

Inicio de sesión con un nombre de usuario y una contraseña.

Para obtener más información, consulte Acceder a los OpenSearch paneles de control como usuario maestro.

Si has iniciado sesión en la AWS consola y accedes a la URL de tu panel de control, iniciarás sesión automáticamente.

Para obtener más información, consulte Acceder a los OpenSearch paneles.

API

Interactúa programáticamente con el OpenSearch Servicio mediante las operaciones de la API del OpenSearch Servicio.

Interactúe mediante programación con OpenSearch Serverless mediante las operaciones de la API Serverless. OpenSearch

Acceso a la red

La configuración de red de un dominio se aplica tanto al punto final del dominio como al punto final de Dashboards. OpenSearch El acceso a la red para ambos está vinculado de forma estrecha.

La configuración de red para el punto final del dominio y el punto final de OpenSearch Dashboards está disociada. Puede optar por no configurar el acceso a la red para los OpenSearch paneles.

Para obtener más información, consulte Acceso a la red para Amazon OpenSearch Serverless.

Firma de solicitudes

Utilice los clientes REST de nivel OpenSearch alto y bajo para firmar las solicitudes. Especifique el nombre del servicio como es.

En este momento, OpenSearch Serverless admite un subconjunto de clientes compatibles OpenSearch con Service.

Al firmar las solicitudes, especifique el nombre del servicio como aoss. El encabezado x-amz-content-sha256 es obligatorio. Para obtener más información, consulte Firma de solicitudes HTTP con otros clientes.

OpenSearch actualizaciones de versión

Los dominios se actualizan manualmente a medida que hay nuevas versiones OpenSearch disponibles de. Es responsable de garantizar que su dominio cumpla con los requisitos de actualización y de que solucionar cualquier cambio importante.

OpenSearch Serverless actualiza automáticamente tus colecciones a nuevas OpenSearch versiones. Las actualizaciones no siempre se producen en cuanto está disponible una nueva versión.

Actualizaciones del software del servicio

De forma manual, aplique las actualizaciones del software del servicio a su dominio a medida que estén disponibles.

OpenSearch Serverless actualiza automáticamente sus colecciones para incluir las últimas correcciones de errores, funciones y mejoras de rendimiento.

Acceso mediante VPC

Puede aprovisionar su dominio dentro de una VPC.

También puede crear puntos finales de OpenSearch VPC gestionados por el servicio adicionales para acceder al dominio.

Usted crea uno o más puntos de enlace de VPC OpenSearch gestionados por Serverless para su cuenta. A continuación, incluya estos puntos de conexión dentro de las políticas de red.

Autenticación SAML

La autenticación SAML se habilita por dominio.

Para obtener más información, consulte Autenticación SAML para paneles OpenSearch .

Configure uno o más proveedores de SAML a nivel de cuenta y, a continuación, incluya los ID de usuario y de grupo asociados dentro de las políticas de acceso a los datos.

Para obtener más información, consulte Autenticación SAML para Amazon Serverless OpenSearch .

Transport Layer Security (TLS) OpenSearch El servicio es compatible con TLS 1.2, pero se recomienda usar TLS 1.3. OpenSearch Serverless es compatible con TLS 1.2, pero se recomienda usar TLS 1.3.