Vectores - Amazon Simple Storage Service

Vectores

nota

Amazon S3 Vectors se encuentra en versión preliminar para Amazon Simple Storage Service y está sujeto a cambios.

Cada vector consta de una clave que identifica de forma única cada vector en un índice vectorial. Además, puede asociar metadatos (por ejemplo, año, autor, género o ubicación) como pares clave-valor a cada vector.

Las operaciones con datos vectoriales incluyen insertar, enumerar, consultar y eliminar vectores. Para generar nuevas incrustaciones vectoriales de los datos no estructurados, puede utilizar la operación de la API InvokeModel de Amazon Bedrock para especificar el ID del modelo de incrustación que desea utilizar. Además, la herramienta de código abierto Amazon S3 Vectors Embed CLI proporciona una forma simplificada de generar incrustaciones y realizar búsquedas semánticas desde la línea de comandos. Para obtener más información sobre esta herramienta de código abierto que automatiza tanto la generación de incrustaciones vectoriales con los modelos fundacionales de Amazon Bedrock como las operaciones de búsqueda semántica en los índices vectoriales de S3, consulte Creación de incrustaciones vectoriales y realización de búsquedas semánticas con s3vectors-embed-cli.

Conceptos sobre los vectores

Claves vectoriales: cada vector se identifica mediante una clave de vector única dentro del índice. Las claves vectoriales pueden tener una longitud máxima de 1024 caracteres y deben ser únicas dentro del índice vectorial. En las claves se distingue entre mayúsculas y minúsculas y pueden contener cualquier carácter UTF-8.

Dimensión vectorial: una dimensión es el número de valores de un vector. Las dimensiones más grandes requieren más espacio de almacenamiento. Todos los vectores de un índice deben tener el mismo número de dimensiones, que se especifica al crear el índice. Una dimensión debe ser un entero entre 1 y 4096.

Metadatos: puede adjuntar metadatos a los vectores como pares clave-valor para proporcionar contexto adicional y permitir el filtrado durante las consultas. Los metadatos incluyen claves de metadatos filtrables y no filtrables. Los metadatos filtrables se utilizan para filtrar las consultas. Las claves de metadatos no filtrables se especifican durante la creación de un índice vectorial y proporcionan contexto adicional, pero no se pueden usar para el filtrado. Los metadatos admiten tipos de cadena, número y booleano. Para obtener más información sobre los metadatos filtrables y no filtrables, consulte Filtrado de metadatos. Para obtener más información sobre los límites de metadatos, incluidos los límites de tamaño por vector y el número máximo de claves de metadatos por vector, consulte Limitaciones y restricciones.