S3 Vectors 最佳實務 - Amazon Simple Storage Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

S3 Vectors 最佳實務

Amazon S3 Vectors 提供專用、成本最佳化的向量儲存,供支援 AI 的應用程式使用,並對存放在 Amazon S3 中的內容進行語意搜尋。S3 Vectors 旨在提供 S3 層級彈性和耐久性,以儲存具有一秒查詢效能的向量資料集,非常適合需要建置和增長向量索引的應用程式。透過 S3 Vectors,您可以使用專用 API 操作集來儲存、存取和對向量資料執行相似性查詢,而無需佈建任何基礎設施。如需詳細資訊,請參閱使用 S3 向量和向量儲存貯體

為了確保 S3 Vectors 的最大效益,建議您執行下列最佳實務。

插入和刪除向量

您的應用程式可以實現每個向量索引每秒至少五個 PutVectorsDeleteVectors 請求。如果您超過請求率,您可能會收到429 TooManyRequestsException錯誤。為了最大化請求輸送量並最佳化速度和效率,建議您大量插入和刪除向量,每個 API 請求最多 500 個向量。如需詳細資訊,請參閱向量索引

存取和查詢 S3 向量索引中的向量

您的應用程式可以實現每個 S3 向量索引每秒數百個 QueryVectorsGetVectorsListVectors 請求。如果您超過請求率,您可能會收到429 TooManyRequestsException錯誤。我們建議您使用重試機制,並將應用程式設定為傳送較少的請求。

跨向量索引擴展

為了改善每個向量索引的查詢效能,請考慮設定您的應用程式,盡可能將向量分割為多個向量索引。例如,如果您有多租用戶工作負載,且應用程式會個別查詢每個租用戶,請考慮將每個租用戶的向量儲存在單獨的向量索引中。如需詳細資訊,請參閱向量索引

實作具有個別向量索引的多租用戶

您可以使用每個租用戶的單一向量索引來組織向量資料,以實現多租用戶。您可以使用 IAM 和儲存貯體政策,限制每個租用戶只能存取其指定的向量索引。此方法有助於維護資料隔離,並藉由消除為每個租用戶建立個別儲存貯體的需求,簡化管理。如需詳細資訊,請參閱S3 向量中的身分和存取管理

設定向量索引不可篩選的中繼資料欄位

建立向量索引時,請將不需要篩選的中繼資料欄位設定為不可篩選的中繼資料金鑰。例如,當您只需要用於參考時,請將向量內嵌的文字區塊儲存為不可篩選的中繼資料欄位。如需詳細資訊,請參閱無法篩選的中繼資料