Opciones de bases de datos vectoriales - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Opciones de bases de datos vectoriales

AWS ofrece una amplia gama de soluciones de bases de datos vectoriales para respaldar diferentes casos de uso y requisitos en aplicaciones de IA generativa. Estas opciones se pueden clasificar en términos generales en servicios de bases de datos individuales y ofertas de servicios gestionados, cada uno con características y ventajas distintas. Comprender estas opciones es crucial para las organizaciones que desean implementar las capacidades de búsqueda vectorial de manera eficaz y, al mismo tiempo, mantener un rendimiento, una escalabilidad y una rentabilidad óptimos.

Para obtener más información sobre las soluciones de bases de datos vectoriales, consulte las siguientes secciones:

Opciones de bases de datos vectoriales individuales

Las opciones de bases de datos vectoriales individuales disponibles AWS incluyen Amazon Kendra, Amazon OpenSearch Service y Amazon RDS for PostgreSQL con pgvector. (Una extensión de código abierto, pgvector añade la capacidad de almacenar y buscar incrustaciones vectoriales generadas por el aprendizaje automático (ML).) Estas soluciones ofrecen diferentes enfoques de búsqueda vectorial, lo que permite a las organizaciones elegir en función de la infraestructura existente, los requisitos técnicos y los casos de uso específicos.

Amazon Kendra

Amazon Kendra es un servicio de búsqueda inteligente de nivel empresarial que utiliza el procesamiento del lenguaje natural y algoritmos avanzados de aprendizaje automático para devolver respuestas específicas a las preguntas de búsqueda a partir de sus datos. Amazon Kendra simplifica la implementación de la funcionalidad de búsqueda y la convierte en una solución de backend eficaz para aplicaciones de IA generativa.

Otras características clave de Amazon Kendra son las siguientes:

  • Conexiones nativas a más de 40 fuentes de datos

  • Capacidades de preparación de datos integradas

  • Configuración rápida que no requiere una gran experiencia técnica

Entre las ventajas de Amazon Kendra se incluyen las siguientes:

Para obtener más información, consulte las ventajas de Amazon Kendra en la Guía para desarrolladores de Amazon Kendra.

OpenSearch Servicio Amazon

Amazon OpenSearch Service es un servicio gestionado que le ayuda a implementar, operar y escalar clústeres de OpenSearch servicios en Nube de AWS.

Las principales capacidades del OpenSearch servicio incluyen las siguientes:

  • Motor de búsqueda y análisis de código abierto

  • Arquitectura distribuida

  • Procesamiento de datos en tiempo real

Algunas de las ventajas de utilizar el OpenSearch Servicio son las siguientes:

  • Escalabilidad horizontal

  • RESTful Soporte de API

  • Maneja datos estructurados y no estructurados

  • Análisis en tiempo real

  • Adecuado para varios tamaños de despliegue

Para obtener más información, consulta Características de Amazon OpenSearch Service en la Guía para desarrolladores de OpenSearch servicios.

Amazon RDS para PostgreSQL con pgvector

Amazon RDS para PostgreSQL con pgvectorcombina el servicio de bases de datos relacionales AWS gestionadas con la extensión de procesamiento vectorial de PostgreSQL. Esta combinación permite a las organizaciones almacenar y consultar vectores de alta dimensión y, al mismo tiempo, mantener Amazon RDS. La solución es especialmente adecuada para aplicaciones de IA generativa que requieren operaciones vectoriales en tiempo real sin la sobrecarga de administrar la infraestructura de bases de datos.

Principales ventajas de Amazon RDS para PostgreSQL con pgvector son:

  • Alta disponibilidad

  • Conmutación por error automática

  • Rentable () pay-per-use

  • Monitorización integrada

  • Integración de datos vectoriales en tiempo real

Para obtener más información, consulte Ventajas de Amazon RDS en la Guía del usuario de Amazon Relational Database Service.

Opción de servicio gestionado

Amazon Bedrock Knowledge Bases representa el enfoque AWS totalmente gestionado para la implementación de bases de datos vectoriales. La flexibilidad del servicio en cuanto a las opciones de almacenamiento, combinada con sus funciones de administración automatizada, lo hacen especialmente valioso para las organizaciones que buscan implementar RAG sin administrar una infraestructura compleja.

Con las bases de conocimiento de Amazon Bedrock, puede crear, mantener y consultar bases de conocimiento que mejoren sus modelos básicos mediante RAG. Este servicio simplifica el complejo proceso de implementación de RAG al administrar todo el proceso de ingesta, vectorización y recuperación de datos.

Entre las principales ventajas de las bases de conocimiento de Amazon Bedrock se incluyen las siguientes:

Procesamiento de datos simplificado

  • Ingestión y fragmentación automáticas de datos

  • Extracción de texto integrada de varios formatos de archivo

  • Generación gestionada de incrustaciones vectoriales

  • Extracción e indexación automáticas de metadatos

Implementación simplificada de RAG

  • Estrategias de recuperación preconfiguradas

  • Optimización automática de la ventana de contexto

  • Ajuste de relevancia incorporado

  • Capacidades de búsqueda semántica listas para usar

Seguridad y gobernanza

  • Controles integrados AWS Identity and Access Management (IAM)

  • Cifrado de datos en reposo y en tránsito

  • Compatibilidad con VPC

  • Audite el registro con AWS CloudTrail

Las bases de conocimiento de Amazon Bedrock admiten varias opciones de almacenamiento de vectores. La siguiente lista proporciona un resumen de las principales características de cada opción:

  • Amazon Aurora PostgreSQL con pgvector

    • Almacenamiento vectorial compatible con PostgreSQL

    • Integrado con las bases de datos Aurora existentes

    • Rentable para despliegues más pequeños

    • Ideal para datos híbridos estructurados y no estructurados

  • Análisis por Amazon Neptune

    • Búsqueda vectorial basada en gráficos

    • Combina datos de relaciones con vectores

    • Ideal para casos de uso de datos conectados

    • Capacidades de consulta avanzadas

  • Amazon OpenSearch Serverless

    • Experiencia sin servidor totalmente gestionada

    • Escalado automático en función de la carga de trabajo

    • Capacidades K-nN integradas

    • Rentable para cargas de trabajo variables

  • Pinecone

    • Base de datos vectorial diseñada específicamente

    • Alto rendimiento a escala

    • Funciones avanzadas de búsqueda de similitudes

    • Administrado a través de la consola Amazon Bedrock

  • Redis Nube empresarial

    • Capacidades de búsqueda vectorial en memoria

    • Rendimiento de baja latencia

    • Búsqueda vectorial en tiempo real

    • Capacidades de almacenamiento en caché integradas

Al elegir un almacén de vectores compatible con las bases de conocimiento de Amazon Bedrock, tenga en cuenta las siguientes características clave de cada opción:

  • Aurora PostgreSQL: datos relacionales con capacidades vectoriales

  • Neptune Analytics: representaciones del conocimiento basadas en gráficos

  • OpenSearch Servicio: enfoque de búsqueda y análisis

  • Pinecone — Rendimiento de búsqueda vectorial puro

  • Redis Nube empresarial: necesidades en tiempo real y de baja latencia

Cada implementación ofrece las siguientes ventajas únicas:

  • Aurora PostgreSQL: ideal para aplicaciones que necesitan capacidades vectoriales y de SQL tradicionales

  • Neptune Analytics: ideal para consultas complejas basadas en relaciones y gráficos de conocimiento

  • OpenSearch Servicio: sólido en búsquedas y análisis de texto completo

  • Pinecone — Optimizado para operaciones vectoriales puras

  • Redis Nube empresarial: ideal para aplicaciones en tiempo real

Los siguientes son algunos puntos clave que debe tener en cuenta al seleccionar un almacén de vectores para su solución RAG:

  • Escalabilidad: capacidad para gestionar conjuntos de datos grandes y crecientes de manera eficiente.

  • Rendimiento de consultas: capacidades de búsqueda de vecinos más cercanos rápidas y eficientes.

  • Ingesta de datos: requisitos del modelo de datos existente. Support para diversos formatos de datos y facilidad de ingesta.

  • Filtrado y clasificación: mecanismos avanzados de filtrado y clasificación para los resultados recuperados.

  • Integración: integración perfecta con otros sistemas y herramientas a través de APIs nuestros protocolos.

  • Persistencia y durabilidad: opciones adecuadas de persistencia y durabilidad (en memoria o basadas en disco).

  • Simultaneidad y coherencia: gestión eficiente del acceso simultáneo y de la coherencia de los datos.

  • Licencias y costos: evaluación del modelo de licencias, los costos iniciales y continuos y la dependencia de un proveedor.

  • Comunidad y apoyo: comunidad dinámica y documentación completa.

  • Seguridad y cumplimiento: cumplimiento de los requisitos de seguridad y cumplimiento necesarios.