Buckets vectoriales - Amazon Simple Storage Service

Buckets vectoriales

nota

Amazon S3 Vectors se encuentra en versión preliminar para Amazon Simple Storage Service y está sujeto a cambios.

Los buckets vectoriales son un tipo de bucket de S3 diseñado específicamente para almacenar y consultar datos vectoriales. Los buckets vectoriales utilizan API dedicadas para administrar los datos vectoriales de forma eficiente y reducir los costos de carga, almacenamiento y consulta de incrustaciones vectoriales. Los buckets vectoriales proporcionan la base para organizar los datos vectoriales en índices, lo que le permite realizar búsquedas de similitud en conjuntos de datos de gran tamaño a la vez que se beneficia de la disponibilidad, durabilidad, escalabilidad y rentabilidad de Amazon S3.

Los buckets vectoriales están optimizados para el almacenamiento de vectores a largo plazo con tiempos de búsqueda inferiores al segundo. Puede realizar consultas de similitud en los datos vectoriales y, opcionalmente, asociar metadatos para filtrar las consultas en función de condiciones específicas como fechas, categorías o preferencias del usuario.

Cada bucket vectorial tiene un nombre de recurso de Amazon (ARN) único y una política de recursos adjunta. Los ARN de los buckets vectoriales se ajustan al formato siguiente:

arn:aws:s3vector:Region:OwnerAccountID:bucket/bucket-name

Dentro de un bucket vectorial, se crean índices vectoriales para almacenar y consultar los datos. Cada bucket vectorial existe dentro de una región de AWS específica y se pueden crear múltiples índices vectoriales dentro de un bucket vectorial. Los buckets vectoriales admiten mecanismos de seguridad y control de acceso, incluidas las políticas de IAM basadas en identidad y las políticas de bucket. Puede utilizar las políticas de bucket para conceder o restringir el acceso a índices específicos dentro del bucket vectorial.

Características clave de los buckets vectoriales:

  • Personalizados para el almacenamiento de vectores y las operaciones de búsqueda de similitudes.

  • Las escrituras de alta coherencia garantizan el acceso inmediato a los datos vectoriales.

  • Optimización automática de datos vectoriales para obtener la mejor relación precio-rendimiento a medida que se escalan los conjuntos de datos.

Para obtener más información sobre los límites del índice vectorial por bucket y otras limitaciones, consulte Restricciones y limitaciones.