S3 Vectors 모범 사례

Amazon S3 Vectors는 AI 지원 애플리케이션 및 Amazon S3에 저장된 콘텐츠의 시맨틱 검색에 사용할 수 있도록 특별히 구축되고 비용 최적화된 벡터 스토리지를 제공합니다. 1초 미만의 쿼리 성능으로 벡터 데이터세트를 저장하기 위한 S3 수준의 탄력성과 내구성을 제공하도록 설계된 S3 Vectors는 벡터 인덱스를 구축하고 확장해야 하는 애플리케이션에 적합합니다. S3 Vectors를 사용하면 전용 API 작업 세트를 사용하여 인프라를 프로비저닝하지 않고도 벡터 데이터에 대한 유사성 쿼리를 저장, 액세스 및 수행할 수 있습니다. 자세한 정보는 S3 Vectors 및 벡터 버킷 작업을 참조하세요.

S3 Vectors를 최대한 활용하려면 다음과 같은 모범 사례를 수행하는 것이 좋습니다.

벡터 삽입 및 삭제: 애플리케이션은 벡터 인덱스당 초당 최소 5개의 PutVectors 및 DeleteVectors 요청을 달성할 수 있습니다. 요청 속도를 초과하면 429 TooManyRequestsException 오류가 발생할 수 있습니다. 요청 처리량을 극대화하고 속도와 효율성을 최적화하려면 API 요청당 최대 500개의 벡터를 대량 배치로 삽입 및 삭제하는 것이 좋습니다. 자세한 정보는 벡터 인덱스을 참조하세요.
S3 벡터 인덱스에서 벡터 액세스 및 쿼리: 애플리케이션은 하나의 S3 벡터 인덱스에서 초당 수백 개의 QueryVectors, GetVectors 또는 ListVectors 요청을 달성할 수 있습니다. 요청 속도를 초과하면 429 TooManyRequestsException 오류가 발생할 수 있습니다. 재시도 메커니즘을 사용하고 더 적은 요청을 보내도록 애플리케이션을 구성하는 것이 좋습니다.
벡터 인덱스 간 규모 조정: 벡터 인덱스당 쿼리 성능을 개선하려면 가능한 경우 여러 벡터 인덱스로 벡터를 분할하도록 애플리케이션을 구성하는 것이 좋습니다. 예를 들어 다중 테넌트 워크로드가 있고 애플리케이션이 각 테넌트를 독립적으로 쿼리하는 경우 각 테넌트의 벡터를 별도의 벡터 인덱스에 저장하는 것이 좋습니다. 자세한 정보는 벡터 인덱스을 참조하세요.
별도의 벡터 인덱스를 사용하여 다중 테넌시 구현: 각 테넌트에 대해 단일 벡터 인덱스를 사용하여 벡터 데이터를 구성하면 다중 테넌시를 달성할 수 있습니다. IAM 및 버킷 정책을 사용하여 각 테넌트의 액세스를 지정된 벡터 인덱스로만 제한할 수 있습니다. 이 접근 방식은 각 테넌트에 대해 별도의 버킷을 만들 필요가 없으므로 데이터 격리를 유지하고 관리를 간소화하는 데 도움이 됩니다. 자세한 정보는 S3 Vectors의 Identity and Access Management을 참조하세요.
벡터 인덱스에 대해 필터링 불가능한 메타데이터 필드 구성: 벡터 인덱스를 만들 때 필터링이 필요하지 않은 메타데이터 필드를 필터링 불가능한 메타데이터 키로 구성합니다. 예를 들어 벡터 임베딩용 텍스트 청크는 참조용으로만 필요한 경우 필터링 불가능한 메타데이터 필드로 저장합니다. 자세한 정보는 필터링 불가능한 메타데이터 키을 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

한계 및 제한

s3vectors-embed-cli를 사용하여 벡터 임베딩 생성 및 검색