Búsqueda puntual en Amazon OpenSearch Service - OpenSearch Servicio Amazon

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Búsqueda puntual en Amazon OpenSearch Service

Un punto en el tiempo (PIT) es un tipo de búsqueda que te permite ejecutar diferentes consultas en un conjunto de datos fijo en el tiempo. Normalmente, cuando ejecuta la misma consulta en el mismo índice en distintos puntos en el tiempo, recibe resultados diferentes porque los documentos se indexan, actualizan y eliminan constantemente. Con PIT, puede realizar consultas en función de un estado constante de su conjunto de datos.

El uso principal de la búsqueda PIT es combinarla con search_after la funcionalidad. Este es el método de paginación preferido OpenSearch, especialmente para la paginación profunda, porque funciona en un conjunto de datos que está congelado en el tiempo, no está vinculado a una consulta y admite una paginación coherente hacia adelante y hacia atrás. Puede usar PIT con un dominio que ejecute OpenSearch la versión 2.5.

nota

En este tema se proporciona información general sobre PIT y algunos aspectos a tener en cuenta a la hora de utilizarlo en un dominio gestionado de Amazon OpenSearch Service en lugar de en un OpenSearch clúster autogestionado. Para obtener la documentación completa de PIT, incluida una referencia exhaustiva sobre la API, consulte Point in Time en la OpenSearch documentación de código abierto.

Consideraciones

Al configurar las búsquedas PIT, tenga en cuenta lo siguiente:

  • Si vas a realizar una actualización desde un dominio que ejecuta la OpenSearch versión 2.3 y necesitas un control de acceso detallado para las acciones de PIT, tendrás que añadir esas acciones y funciones manualmente.

  • El PIT no tiene capacidad de recuperación. El reinicio de los nodos, la terminación de los nodos, las implementaciones en azul o verde y los reinicios de los OpenSearch procesos provocan la pérdida de todos los datos PIT.

  • Si una partición se reubica durante la implementación azul/verde, solo los segmentos de datos activos se transfieren al nuevo nodo. Los segmentos de particiones retenidos por PIT (tanto de forma exclusiva como el que se comparte con los datos activos) permanecen en el nodo anterior.

  • Actualmente, las búsquedas PIT no funcionan con la búsqueda asíncrona.

Creación de un PIT

Para ejecutar una consulta PIT, envíe las solicitudes HTTP a _search/point_in_time utilizando el siguiente formato:

POST opensearch-domain/my-index/_search/point_in_time?keep_alive=time

Puede especificar las siguientes opciones de PIT:

Opciones Descripción Valor predeterminado Obligatoria
keep_alive

La cantidad de tiempo que debe durar la conservación del PIT. Cada vez que se accede a un PIT con una solicitud de búsqueda, la vida útil del PIT se prolonga en un tiempo igual al parámetro keep_alive. Este parámetro de consulta es obligatorio cuando se crea un PIT, pero es opcional en una solicitud de búsqueda.

preference

Una cadena que especifica el nodo o la partición utilizados para realizar la búsqueda.

Random No
routing Una cadena que especifica que las solicitudes de búsqueda se dirijan a una partición específica. El _id del documento No
expand_wildcards Una cadena que especifica el tipo de índice que puede coincidir con el patrón comodín. Admite valores separados por comas. Los valores válidos son los siguientes:
  • all: Coincide con cualquier índice o flujo de datos, incluidos los ocultos.

  • open: Coincide con índices abiertos, no ocultos o flujos de datos no ocultos.

  • closed: Coincide con índices cerrados, no ocultos o flujos de datos no ocultos.

  • hidden: Coincide con índices o flujos de datos ocultos. Debe combinarse con índices abiertos, cerrados o tanto abiertos como cerrados.

  • none: No se aceptan patrones comodín.

open No
allow_partial_pit_creation Un valor booleano que especifica si se debe crear un PIT con errores parciales. true No

Respuesta de ejemplo

{ "pit_id": "o463QQEPbXktaW5kZXgtMDAwMDAxFnNOWU43ckt3U3IyaFVpbGE1UWEtMncAFjFyeXBsRGJmVFM2RTB6eVg1aVVqQncAAAAAAAAAAAIWcDVrM3ZIX0pRNS1XejE5YXRPRFhzUQEWc05ZTjdyS3dTcjJoVWlsYTVRYS0ydwAA", "_shards": { "total": 1, "successful": 1, "skipped": 0, "failed": 0 }, "creation_time": 1658146050064 }

Al crear un PIT, recibirá un ID de PIT en la respuesta. Este es el ID que se utiliza para realizar búsquedas con el PIT.

Permisos de puntos en el tiempo

Los PIT admiten el control de acceso detallado. Si vas a actualizar a un dominio de la OpenSearch versión 2.5 y necesitas un control de acceso detallado, debes crear roles manualmente con los siguientes permisos:

# Allows users to use all point in time search search functionality point_in_time_full_access: reserved: true index_permissions: - index_patterns: - '*' allowed_actions: - "indices:data/read/point_in_time/create" - "indices:data/read/point_in_time/delete" - "indices:data/read/point_in_time/readall" - "indices:data/read/search" - "indices:monitor/point_in_time/segments" # Allows users to use point in time search search functionality for specific index # All type operations like list all PITs, delete all PITs are not supported in this case point_in_time_index_access: reserved: true index_permissions: - index_patterns: - 'my-index-1' allowed_actions: - "indices:data/read/point_in_time/create" - "indices:data/read/point_in_time/delete" - "indices:data/read/search" - "indices:monitor/point_in_time/segments"

Para los dominios con OpenSearch la versión 2.5 o superior, puedes usar el rol integradopoint_in_time_full_access. Para obtener más información, consulte el modelo de seguridad en la OpenSearch documentación.

Configuración de PIT

OpenSearch permite cambiar todos los ajustes PIT disponibles mediante la _cluster/settings API. En OpenSearch Service, actualmente no puedes modificar la configuración.

Búsqueda en clústeres

Puede crear PIT, buscarlas con identificadores de PIT, enumerarlas y eliminarlas de todos los clústeres con las siguientes limitaciones menores:

  • Puede enumerar todos los PIT y eliminarlos solo en el dominio origen.

  • No puede minimizar los viajes de ida y vuelta de la red como parte de una consulta de búsqueda entre clústeres.

Para obtener más información, consulte Búsqueda entre clústeres en Amazon Service OpenSearch .

UltraWarm

Las búsquedas PIT con UltraWarm índices siguen funcionando. Para obtener más información, consulte UltraWarm almacenamiento para Amazon OpenSearch Service.

nota

Puede supervisar las estadísticas de búsqueda PIT en CloudWatch. Para obtener una lista completa de las métricas, consulte Métricas de un momento dado.