기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
벡터 데이터베이스 옵션
AWS 는 생성형 AI 애플리케이션의 다양한 사용 사례 및 요구 사항을 지원하는 다양한 벡터 데이터베이스 솔루션을 제공합니다. 이러한 옵션은 개별 데이터베이스 서비스 및 관리형 서비스 상품으로 광범위하게 분류할 수 있으며, 각 서비스에는 고유한 특성과 장점이 있습니다. 이러한 옵션을 이해하는 것은 최적의 성능, 확장성 및 비용 효율성을 유지하면서 벡터 검색 기능을 효과적으로 구현하려는 조직에 매우 중요합니다.
벡터 데이터베이스 솔루션에 대한 자세한 내용은 다음 섹션을 참조하세요.
개별 벡터 데이터베이스 옵션
의 개별 벡터 데이터베이스 옵션에는를 사용하는 Amazon Kendra, Amazon OpenSearch Service 및 Amazon RDS for PostgreSQL이 AWS 포함됩니다pgvector. (오픈 소스 확장은 기계 학습(ML) 생성 벡터 임베딩을 저장하고 검색하는 기능을 pgvector 추가합니다.) 이러한 솔루션은 벡터 검색에 대한 다양한 접근 방식을 제공하므로 조직은 기존 인프라, 기술 요구 사항 및 특정 사용 사례를 기반으로 선택할 수 있습니다.
Amazon Kendra
Amazon Kendra는 자연어 처리 및 고급 기계 학습 알고리즘을 사용하여 데이터의 검색 질문에 대한 특정 답변을 반환하는 엔터프라이즈급 지능형 검색 서비스입니다. Amazon Kendra는 검색 기능의 구현을 간소화하여 생성형 AI 애플리케이션을 위한 효과적인 백엔드 솔루션입니다.
Amazon Kendra의 다른 주요 기능은 다음과 같습니다.
-
40개 이상의 데이터 소스
에 대한 기본 연결 -
기본 제공 데이터 준비 기능
-
심층적인 기술 전문 지식이 필요하지 않은 빠른 설정
Amazon Kendra의 이점은 다음과 같습니다.
-
자동 데이터 처리(청킹, 수집, 검색)
-
강력한 사용자 지정 옵션:
-
를 통한 간단한 프로그래밍 방식 액세스 AWS SDK for Python (Boto3)
자세한 내용은 Amazon Kendra 개발자 안내서의 Amazon Kendra의 이점을 참조하세요.
Amazon OpenSearch Service
Amazon OpenSearch Service는에서 OpenSearch Service 클러스터를 배포, 운영 및 확장하는 데 도움이 되는 관리형 서비스입니다 AWS 클라우드.
OpenSearch Service의 핵심 기능은 다음과 같습니다.
-
오픈 소스 검색 및 분석 엔진
-
분산 아키텍처
-
실시간 데이터 처리
OpenSearch Service 사용의 몇 가지 이점은 다음과 같습니다.
-
수평 확장성
-
RESTful API 지원
-
정형 및 비정형 데이터 처리
-
실시간 데이터 분석
-
다양한 배포 크기에 적합
자세한 내용은 OpenSearch Service 개발자 안내서의 Amazon OpenSearch Service 기능을 참조하세요.
를 사용한 Amazon RDS for PostgreSQL pgvector
Amazon RDS for PostgreSQL과는 AWS 관리형 관계형 데이터베이스 서비스를 PostgreSQL의 벡터 처리 확장과 pgvector
를 사용하는 Amazon RDS for PostgreSQL의 주요 이점은 다음과 pgvector 같습니다.
-
높은 가용성
-
자동 장애조치(failover)
-
비용 효율성(pay-per-use)
-
기본 제공 모니터링
-
실시간 벡터 데이터 통합
자세한 내용은 Amazon Relational Database Service 사용 설명서의 Amazon RDS의 이점을 참조하세요. Amazon Relational Database Service
관리형 서비스 옵션
Amazon Bedrock 지식 기반은 벡터 데이터베이스 구현에 대한 AWS 완전 관리형 접근 방식을 나타냅니다. 이 서비스의 스토리지 옵션 유연성은 자동화된 관리 기능과 결합되어 복잡한 인프라를 관리하지 않고 RAG를 구현하려는 조직에 특히 유용합니다.
Amazon Bedrock 지식 기반을 사용하면 RAG를 사용하여 파운데이션 모델을 개선하는 지식 기반을 생성, 유지 관리 및 쿼리할 수 있습니다. 이 서비스는 전체 데이터 수집, 벡터화 및 검색 파이프라인을 관리하여 RAG를 구현하는 복잡한 프로세스를 간소화합니다.
Amazon Bedrock 지식 기반의 주요 이점은 다음과 같습니다.
간소화된 데이터 처리
-
자동 데이터 수집 및 청킹
-
여러 파일 형식에서 기본 제공 텍스트 추출
-
관리형 벡터 임베딩 생성
-
자동 메타데이터 추출 및 인덱싱
간소화된 RAG 구현
-
미리 구성된 검색 전략
-
자동 컨텍스트 창 최적화
-
기본 제공 관련성 튜닝
-
시맨틱 검색 기능 즉시 사용 가능
보안 및 거버넌스
-
통합 AWS Identity and Access Management (IAM) 제어
-
저장 및 전송 중 데이터 암호화
-
VPC 지원
-
를 사용한 감사 로깅 AWS CloudTrail
Amazon Bedrock 지식 기반은 여러 벡터 스토어 옵션을 지원합니다. 다음 목록은 각 옵션의 주요 기능에 대한 개요를 제공합니다.
-
를 사용한 Amazon Aurora PostgreSQL pgvector
-
PostgreSQL 호환 벡터 스토리지
-
기존 Aurora 데이터베이스와 통합
-
소규모 배포에 비용 효율적
-
하이브리드 정형 및 비정형 데이터에 적합
-
-
Amazon Neptune Analytics
-
그래프 기반 벡터 검색
-
관계 데이터를 벡터와 결합합니다.
-
연결된 데이터 사용 사례에 적합
-
고급 쿼리 기능
-
-
Amazon OpenSearch Serverless
-
완전 관리형 서버리스 환경
-
워크로드에 따른 자동 조정
-
기본 제공 k-NN 기능
-
다양한 워크로드에 비용 효율적
-
-
Pinecone
-
목적별 벡터 데이터베이스
-
대규모 고성능
-
고급 유사성 검색 기능
-
Amazon Bedrock 콘솔을 통해 관리됨
-
-
Redis 엔터프라이즈 클라우드
-
인 메모리 벡터 검색 기능
-
지연 시간이 짧은 성능
-
실시간 벡터 검색
-
통합 캐싱 기능
-
Amazon Bedrock 지식 기반에서 지원하는 벡터 스토어를 선택할 때는 각 옵션의 다음과 같은 주요 특성을 고려하세요.
-
Aurora PostgreSQL - 벡터 기능과의 관계형 데이터
-
Neptune 분석 - 그래프 기반 지식 표현
-
OpenSearch Service - 검색 및 분석 포커스
-
Pinecone - 순수 벡터 검색 성능
-
Redis 엔터프라이즈 클라우드 - 지연 시간이 짧은 실시간 요구 사항
각 구현은 다음과 같은 고유한 이점을 제공합니다.
-
Aurora PostgreSQL - 기존 SQL 및 벡터 기능이 모두 필요한 애플리케이션에 가장 적합
-
Neptune 분석 - 복잡한 관계 기반 쿼리 및 지식 그래프에 적합
-
OpenSearch Service - 강력한 전체 텍스트 검색 및 분석
-
Pinecone - 순수 벡터 작업에 최적화됨
-
Redis 엔터프라이즈 클라우드 - 실시간 애플리케이션에 가장 적합
다음은 RAG 솔루션의 벡터 스토어를 선택할 때 고려해야 할 몇 가지 주요 사항입니다.
-
확장성 - 크고 증가하는 데이터 세트를 효율적으로 처리할 수 있습니다.
-
쿼리 성능 - 가장 가까운 이웃 검색 기능을 빠르고 효율적으로 제공합니다.
-
데이터 수집 - 기존 데이터 모델 요구 사항입니다. 다양한 데이터 형식과 수집 용이성을 지원합니다.
-
필터링 및 순위 지정 - 검색된 결과를 위한 고급 필터링 및 순위 지정 메커니즘입니다.
-
통합 - APIs.
-
지속성 및 내구성 - 적합한 지속성 및 내구성 옵션(인 메모리 또는 디스크 기반).
-
동시성 및 일관성 - 동시 액세스 및 데이터 일관성을 효율적으로 처리합니다.
-
라이선스 및 비용 - 라이선스 모델 평가, 선결제 및 진행 비용, 공급업체 잠금.
-
커뮤니티 및 지원 - 생생한 커뮤니티 및 포괄적인 설명서.
-
보안 및 규정 준수 - 필요한 보안 및 규정 준수 요구 사항을 준수합니다.