Prácticas recomendadas de S3 Vectors - Amazon Simple Storage Service

Prácticas recomendadas de S3 Vectors

Amazon S3 Vectors ofrece almacenamiento vectorial optimizado para el costo y personalizado a fin de usarlo en aplicaciones habilitadas para IA y la búsqueda semántica del contenido almacenado en Amazon S3. S3 Vectors, que se ha diseñado para proporcionar elasticidad y durabilidad de nivel de S3 a fin de almacenar conjuntos de datos vectoriales con un rendimiento de consultas inferior a un segundo, es ideal para aplicaciones que necesitan crear y ampliar índices vectoriales. Con S3 Vectors, puede utilizar un conjunto dedicado de operaciones de la API para almacenar y realizar consultas de similitud en datos vectoriales, así como acceder a ellas, sin aprovisionar ninguna infraestructura. Para obtener más información, consulte Uso de S3 Vectors y buckets vectoriales.

Se recomienda realizar las siguientes prácticas recomendadas si desea aprovechar al máximo los beneficios de S3 Vectors.

Inserción y eliminación de vectores

La aplicación puede alcanzar al menos cinco solicitudes PutVectors y DeleteVectors por segundo por índice vectorial. Si supera las tasas de solicitudes, es posible que reciba un error 429 TooManyRequestsException. Para maximizar el rendimiento de las solicitudes y optimizar la velocidad y la eficiencia, le recomendamos que inserte y elimine vectores en lotes grandes, hasta un máximo de 500 vectores por solicitud de la API. Para obtener más información, consulte Índices vectoriales.

Acceso y consulta de vectores en un índice vectorial de S3

La aplicación puede alcanzar cientos de solicitudes QueryVectors, GetVectors o ListVectors por segundo por cada índice vectorial de S3. Si supera las tasas de solicitudes, es posible que reciba un error 429 TooManyRequestsException. Le recomendamos que utilice un mecanismo de reintentos y configure la aplicación para enviar menos solicitudes.

Escalado entre índices vectoriales

Para mejorar el rendimiento de las consultas por índice vectorial, considere la posibilidad de configurar la aplicación para dividir los vectores entre varios índices vectoriales cuando sea posible. Por ejemplo, si tiene cargas de trabajo de varios inquilinos y la aplicación consulta cada inquilino de forma independiente, considere la posibilidad de almacenar los vectores de cada inquilino en un índice vectorial aparte. Para obtener más información, consulte Índices vectoriales.

Implementación de la multitenencia con índices vectoriales independientes

Puede alcanzar la multitenencia si organiza los datos vectoriales mediante un único índice vectorial para cada inquilino. Puede utilizar políticas de IAM y de bucket para restringir el acceso de cada inquilino solo al índice vectorial designado. Este enfoque ayuda a mantener el aislamiento de los datos y simplifica la administración al eliminar la necesidad de crear buckets separados para cada inquilino. Para obtener más información, consulte Administración de identidades y accesos en S3 Vectors.

Configuración de campos de metadatos no filtrables para índices vectoriales

Al crear un índice vectorial, configure los campos de metadatos que no requieran filtrado como claves de metadatos no filtrables. Por ejemplo, almacene fragmentos de texto para incrustaciones vectoriales como campos de metadatos no filtrables cuando solo los necesite como referencia. Para obtener más información, consulte Metadatos no filtrables.