本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
S3 Vectors 最佳實務
Amazon S3 Vectors 提供專用、成本最佳化的向量儲存,供支援 AI 的應用程式使用,並對存放在 Amazon S3 中的內容進行語意搜尋。S3 Vectors 旨在提供 S3 層級彈性和耐久性,以儲存具有一秒查詢效能的向量資料集,非常適合需要建置和增長向量索引的應用程式。透過 S3 Vectors,您可以使用專用 API 操作集來儲存、存取和對向量資料執行相似性查詢,而無需佈建任何基礎設施。如需詳細資訊,請參閱使用 S3 向量和向量儲存貯體。
為了確保 S3 Vectors 的最大效益,建議您執行下列最佳實務。
- 插入和刪除向量
-
您的應用程式可以實現每個向量索引每秒至少五個 PutVectors 和 DeleteVectors 請求。如果您超過請求率,您可能會收到
429 TooManyRequestsException
錯誤。為了最大化請求輸送量並最佳化速度和效率,建議您大量插入和刪除向量,每個 API 請求最多 500 個向量。如需詳細資訊,請參閱向量索引。 - 存取和查詢 S3 向量索引中的向量
-
您的應用程式可以實現每個 S3 向量索引每秒數百個 QueryVectors、GetVectors 或 ListVectors 請求。如果您超過請求率,您可能會收到
429 TooManyRequestsException
錯誤。我們建議您使用重試機制,並將應用程式設定為傳送較少的請求。 - 跨向量索引擴展
-
為了改善每個向量索引的查詢效能,請考慮設定您的應用程式,盡可能將向量分割為多個向量索引。例如,如果您有多租用戶工作負載,且應用程式會個別查詢每個租用戶,請考慮將每個租用戶的向量儲存在單獨的向量索引中。如需詳細資訊,請參閱向量索引。
- 實作具有個別向量索引的多租用戶
-
您可以使用每個租用戶的單一向量索引來組織向量資料,以實現多租用戶。您可以使用 IAM 和儲存貯體政策,限制每個租用戶只能存取其指定的向量索引。此方法有助於維護資料隔離,並藉由消除為每個租用戶建立個別儲存貯體的需求,簡化管理。如需詳細資訊,請參閱S3 向量中的身分和存取管理。
- 設定向量索引不可篩選的中繼資料欄位
-
建立向量索引時,請將不需要篩選的中繼資料欄位設定為不可篩選的中繼資料金鑰。例如,當您只需要用於參考時,請將向量內嵌的文字區塊儲存為不可篩選的中繼資料欄位。如需詳細資訊,請參閱無法篩選的中繼資料。