Opciones de bases de datos vectoriales individuales Opción de servicio gestionado

Opciones de bases de datos vectoriales

AWS ofrece una amplia gama de soluciones de bases de datos vectoriales para respaldar diferentes casos de uso y requisitos en aplicaciones de IA generativa. Estas opciones se pueden clasificar en términos generales en servicios de bases de datos individuales y ofertas de servicios gestionados, cada uno con características y ventajas distintas. Comprender estas opciones es crucial para las organizaciones que desean implementar las capacidades de búsqueda vectorial de manera eficaz y, al mismo tiempo, mantener un rendimiento, una escalabilidad y una rentabilidad óptimos.

Para obtener más información sobre las soluciones de bases de datos vectoriales, consulte las siguientes secciones:

Opciones de bases de datos vectoriales individuales
Opción de servicio gestionado

Opciones de bases de datos vectoriales individuales

Las opciones de bases de datos vectoriales individuales disponibles AWS incluyen Amazon Kendra, Amazon OpenSearch Service y Amazon RDS for PostgreSQL con pgvector. (Una extensión de código abierto, pgvector añade la capacidad de almacenar y buscar incrustaciones vectoriales generadas por el aprendizaje automático (ML).) Estas soluciones ofrecen diferentes enfoques de búsqueda vectorial, lo que permite a las organizaciones elegir en función de la infraestructura existente, los requisitos técnicos y los casos de uso específicos.

Amazon Kendra

Amazon Kendra es un servicio de búsqueda inteligente de nivel empresarial que utiliza el procesamiento del lenguaje natural y algoritmos avanzados de aprendizaje automático para devolver respuestas específicas a las preguntas de búsqueda a partir de sus datos. Amazon Kendra simplifica la implementación de la funcionalidad de búsqueda y la convierte en una solución de backend eficaz para aplicaciones de IA generativa.

Otras características clave de Amazon Kendra son las siguientes:

Conexiones nativas a más de 40 fuentes de datos
Capacidades de preparación de datos integradas
Configuración rápida que no requiere una gran experiencia técnica

Entre las ventajas de Amazon Kendra se incluyen las siguientes:

Procesamiento automatizado de datos (fragmentación, ingestión, recuperación)
Potentes opciones de personalización:
Acceso programático sencillo a través del AWS SDK para Python (Boto3)

Para obtener más información, consulte las ventajas de Amazon Kendra en la Guía para desarrolladores de Amazon Kendra.

OpenSearch Servicio Amazon

Amazon OpenSearch Service es un servicio gestionado que le ayuda a implementar, operar y escalar clústeres de OpenSearch servicios en Nube de AWS.

Las principales capacidades del OpenSearch servicio incluyen las siguientes:

Motor de búsqueda y análisis de código abierto
Arquitectura distribuida
Procesamiento de datos en tiempo real

Algunas de las ventajas de utilizar el OpenSearch Servicio son las siguientes:

Escalabilidad horizontal
RESTful Soporte de API
Maneja datos estructurados y no estructurados
Análisis en tiempo real
Adecuado para varios tamaños de despliegue

Para obtener más información, consulta Características de Amazon OpenSearch Service en la Guía para desarrolladores de OpenSearch servicios.

Amazon RDS para PostgreSQL con pgvector

Amazon RDS para PostgreSQL con pgvectorcombina el servicio de bases de datos relacionales AWS gestionadas con la extensión de procesamiento vectorial de PostgreSQL. Esta combinación permite a las organizaciones almacenar y consultar vectores de alta dimensión y, al mismo tiempo, mantener Amazon RDS. La solución es especialmente adecuada para aplicaciones de IA generativa que requieren operaciones vectoriales en tiempo real sin la sobrecarga de administrar la infraestructura de bases de datos.

Principales ventajas de Amazon RDS para PostgreSQL con pgvector son:

Alta disponibilidad
Conmutación por error automática
Rentable () pay-per-use
Monitorización integrada
Integración de datos vectoriales en tiempo real

Para obtener más información, consulte Ventajas de Amazon RDS en la Guía del usuario de Amazon Relational Database Service.

Opción de servicio gestionado

Amazon Bedrock Knowledge Bases representa el enfoque AWS totalmente gestionado para la implementación de bases de datos vectoriales. La flexibilidad del servicio en cuanto a las opciones de almacenamiento, combinada con sus funciones de administración automatizada, lo hacen especialmente valioso para las organizaciones que buscan implementar RAG sin administrar una infraestructura compleja.

Con las bases de conocimiento de Amazon Bedrock, puede crear, mantener y consultar bases de conocimiento que mejoren sus modelos básicos mediante RAG. Este servicio simplifica el complejo proceso de implementación de RAG al administrar todo el proceso de ingesta, vectorización y recuperación de datos.

Entre las principales ventajas de las bases de conocimiento de Amazon Bedrock se incluyen las siguientes:

Procesamiento de datos simplificado

Ingestión y fragmentación automáticas de datos
Extracción de texto integrada de varios formatos de archivo
Generación gestionada de incrustaciones vectoriales
Extracción e indexación automáticas de metadatos

Implementación simplificada de RAG

Estrategias de recuperación preconfiguradas
Optimización automática de la ventana de contexto
Ajuste de relevancia incorporado
Capacidades de búsqueda semántica listas para usar

Seguridad y gobernanza

Controles integrados AWS Identity and Access Management (IAM)
Cifrado de datos en reposo y en tránsito
Compatibilidad con VPC
Audite el registro con AWS CloudTrail

Las bases de conocimiento de Amazon Bedrock admiten varias opciones de almacenamiento de vectores. La siguiente lista proporciona un resumen de las principales características de cada opción:

Amazon Aurora PostgreSQL con pgvector
- Almacenamiento vectorial compatible con PostgreSQL
- Integrado con las bases de datos Aurora existentes
- Rentable para despliegues más pequeños
- Ideal para datos híbridos estructurados y no estructurados
Análisis por Amazon Neptune
- Búsqueda vectorial basada en gráficos
- Combina datos de relaciones con vectores
- Ideal para casos de uso de datos conectados
- Capacidades de consulta avanzadas
Amazon OpenSearch Serverless
- Experiencia sin servidor totalmente gestionada
- Escalado automático en función de la carga de trabajo
- Capacidades K-nN integradas
- Rentable para cargas de trabajo variables
Pinecone
- Base de datos vectorial diseñada específicamente
- Alto rendimiento a escala
- Funciones avanzadas de búsqueda de similitudes
- Administrado a través de la consola Amazon Bedrock
Redis Nube empresarial
- Capacidades de búsqueda vectorial en memoria
- Rendimiento de baja latencia
- Búsqueda vectorial en tiempo real
- Capacidades de almacenamiento en caché integradas

Al elegir un almacén de vectores compatible con las bases de conocimiento de Amazon Bedrock, tenga en cuenta las siguientes características clave de cada opción:

Aurora PostgreSQL: datos relacionales con capacidades vectoriales
Neptune Analytics: representaciones del conocimiento basadas en gráficos
OpenSearch Servicio: enfoque de búsqueda y análisis
Pinecone — Rendimiento de búsqueda vectorial puro
Redis Nube empresarial: necesidades en tiempo real y de baja latencia

Cada implementación ofrece las siguientes ventajas únicas:

Aurora PostgreSQL: ideal para aplicaciones que necesitan capacidades vectoriales y de SQL tradicionales
Neptune Analytics: ideal para consultas complejas basadas en relaciones y gráficos de conocimiento
OpenSearch Servicio: sólido en búsquedas y análisis de texto completo
Pinecone — Optimizado para operaciones vectoriales puras
Redis Nube empresarial: ideal para aplicaciones en tiempo real

Los siguientes son algunos puntos clave que debe tener en cuenta al seleccionar un almacén de vectores para su solución RAG:

Escalabilidad: capacidad para gestionar conjuntos de datos grandes y crecientes de manera eficiente.
Rendimiento de consultas: capacidades de búsqueda de vecinos más cercanos rápidas y eficientes.
Ingesta de datos: requisitos del modelo de datos existente. Support para diversos formatos de datos y facilidad de ingesta.
Filtrado y clasificación: mecanismos avanzados de filtrado y clasificación para los resultados recuperados.
Integración: integración perfecta con otros sistemas y herramientas a través de APIs nuestros protocolos.
Persistencia y durabilidad: opciones adecuadas de persistencia y durabilidad (en memoria o basadas en disco).
Simultaneidad y coherencia: gestión eficiente del acceso simultáneo y de la coherencia de los datos.
Licencias y costos: evaluación del modelo de licencias, los costos iniciales y continuos y la dependencia de un proveedor.
Comunidad y apoyo: comunidad dinámica y documentación completa.
Seguridad y cumplimiento: cumplimiento de los requisitos de seguridad y cumplimiento necesarios.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Descripción general de las bases de datos vectoriales

Comparación de bases de datos vectoriales