Consulta de vectores
nota
Amazon S3 Vectors se encuentra en versión preliminar para Amazon Simple Storage Service y está sujeto a cambios.
Puede ejecutar una consulta de similitud con la operación de la API QueryVectors, en la que se especifica el vector de consulta, el número de resultados relevantes que se deben devolver (el máximo de vecinos más cercanos) y el ARN del índice. Además, puede utilizar filtros de metadatos en una consulta para buscar solo los vectores que coincidan con el filtro. Si realiza una solicitud para filtrar un campo de metadatos no filtrables, la solicitud devolverá un error 400 Bad
Request
. Para obtener más información sobre el filtrado de metadatos, consulte Filtrado de metadatos.
En la respuesta, se devuelven las claves de vector de forma predeterminada. Opcionalmente, puede incluir la distancia y los metadatos en la respuesta.
Al generar el vector de consulta, debe utilizar el mismo modelo de incrustación vectorial que se utilizó para generar los vectores iniciales almacenados en el índice vectorial. Por ejemplo, si utiliza el modelo Amazon Titan Text Embeddings V2 en Amazon Bedrock para generar incrustaciones vectoriales de los documentos, utilice el mismo modelo de incrustación para convertir una pregunta en un vector de consulta. Además, Bases de conocimientos de Amazon Bedrock proporciona un flujo de trabajo RAG de extremo a extremo totalmente administrado en el que Amazon Bedrock obtiene automáticamente los datos del origen de datos de S3, convierte el contenido en bloques de texto, genera incrustaciones y las almacena en el índice vectorial. A continuación, puede consultar la base de conocimientos y generar respuestas basadas en fragmentos recuperados de los datos de origen. Para obtener más información sobre cómo consultar vectores desde una base de conocimientos de Amazon Bedrock en la consola, consulte (Opcional) Integración de S3 Vectors con Bases de conocimientos de Amazon Bedrock.
Además, la herramienta de código abierto Amazon S3 Vectors Embed CLI proporciona una forma simplificada de realizar búsquedas semánticas desde la línea de comandos. Esta herramienta de código abierto agiliza el proceso de consulta al gestionar tanto la generación de incrustaciones vectoriales con los modelos fundacionales de Amazon Bedrock como la ejecución de operaciones de búsqueda semántica en los índices vectoriales de S3. Para obtener más información sobre cómo utilizar esta herramienta para consultar los datos vectoriales, consulte Creación de incrustaciones vectoriales y realización de búsquedas semánticas con s3vectors-embed-cli.
S3 Vectors ofrece tiempos de latencia de consulta inferiores a un segundo. S3 Vectors utiliza el rendimiento elástico de Amazon S3 para gestionar búsquedas en millones de vectores y es ideal para cargas de trabajo en las que las consultas son menos frecuentes. Para realizar consultas de similitud de las incrustaciones vectoriales, hay varios factores que pueden afectar el rendimiento promedio de la recuperación, como el modelo de incrustación vectorial, el tamaño del conjunto de datos de vectores (el número de vectores y dimensiones) y la distribución de las consultas. S3 Vectors ofrece una recuperación promedio superior al 90 % para la mayoría de los conjuntos de datos. La recuperación promedio mide la calidad de los resultados de la consulta. Una recuperación promedio del 90 % significa que la respuesta contiene el 90 % de los vectores más cercanos reales (datos reales) que se almacenan en el índice vectorial en relación con el vector de consulta. No obstante, dado que el rendimiento real puede variar en función de los casos de uso específicos, le recomendamos que realice pruebas con datos y consultas representativos para validar que S3 Vectors cumple los requisitos de recuperación.