지원되는 벡터 스토어에서 지식 베이스의 벡터 색인을 설정합니다. - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

지원되는 벡터 스토어에서 지식 베이스의 벡터 색인을 설정합니다.

다음 데이터를 저장하는 필드를 생성하여 데이터 소스를 인덱싱하도록 지원되는 벡터 인덱스를 설정합니다.

  • 선택한 임베딩 모델에 의해 데이터 원본의 텍스트에서 생성된 벡터입니다.

  • 데이터 원본의 파일에서 추출한 텍스트 청크.

  • Amazon Bedrock에서 관리하는 지식 기반과 관련된 메타데이터.

  • (Amazon Aurora 데이터베이스를 사용하고 필터링을 설정하려는 경우) 소스 파일에 연결하는 메타데이터. 다른 벡터 스토어에서 필터링을 설정하려는 경우 필터링을 위해 이러한 필드를 설정할 필요가 없습니다.

벡터 색인을 생성하는 데 사용할 서비스에 해당하는 탭을 선택합니다.

참고

Amazon Bedrock이 Amazon OpenSearch Serverless에서 벡터 인덱스를 자동으로 생성하도록 하려면 이 사전 요구 사항을 건너뛰고 다음으로 진행하십시오. 지식 기반 생성 벡터 인덱스를 설정하는 방법을 알아보려면 선택한 방법에 해당하는 탭을 선택하고 단계를 따르십시오.

Amazon OpenSearch Serverless
  1. Amazon OpenSearch Serverless에서 권한을 구성하고 벡터 검색 컬렉션을 생성하려면 Amazon OpenSearch Service 개발자 안내서의 벡터 검색 컬렉션 작업의 1단계와 2단계를 따르십시오. AWS Management Console컬렉션을 설정할 때는 다음 고려 사항을 참고하십시오.

    1. 컬렉션에 원하는 이름과 설명을 입력합니다.

    2. 컬렉션을 비공개로 설정하려면 보안 섹션에서 표준 생성을 선택합니다. 그런 다음 네트워크 액세스 설정 섹션에서 액세스 유형으로 VPC를 선택하고 VPC 엔드포인트를 선택합니다. Amazon OpenSearch Serverless 컬렉션의 VPC 엔드포인트 설정에 대한 자세한 내용은 Amazon Service 개발자 안내서의 인터페이스 엔드포인트 () 를 사용하여 Amazon OpenSearch AWS PrivateLink Serverless에 액세스를 참조하십시오. OpenSearch

  2. 컬렉션이 생성되면 지식 베이스를 생성할 때 사용할 수 있는 컬렉션 ARN을 기록해 두십시오.

  3. 왼쪽 탐색 창의 서버리스에서 컬렉션을 선택합니다. 그런 다음 벡터 검색 컬렉션을 선택합니다.

  4. 인덱스 탭을 선택합니다. 그런 다음 벡터 인덱스 생성을 선택합니다.

  5. 벡터 인덱스 세부 정보 섹션의 벡터 인덱스 이름 필드에 인덱스 이름을 입력합니다.

  6. 벡터 필드 섹션에서 벡터 필드 추가를 선택합니다. Amazon Bedrock은 데이터 소스의 벡터 임베딩을 이 필드에 저장합니다. 다음 구성을 제공하십시오.

    • 벡터 필드 이름 — 필드 이름 (예:embeddings) 을 입력합니다.

    • 엔진 - 검색에 사용되는 벡터 엔진입니다. faiss를 선택합니다.

    • 차원 - 벡터의 차원 개수입니다. 벡터에 포함되어야 하는 차원 수를 결정하려면 다음 표를 참조하십시오.

      모델 차원
      TitanG1 임베딩 - 텍스트 1,536
      CohereEmbed영어 1,024
      CohereEmbed다국어 1,024
    • 거리 지표 - 벡터 간의 유사성을 측정하는 데 사용되는 지표입니다. 유클리드를 사용하는 것이 좋습니다.

  7. 메타데이터 관리 섹션을 확장하고 두 필드를 추가하여 지식 베이스에서 벡터로 검색할 수 있는 추가 메타데이터를 저장하도록 벡터 인덱스를 구성하십시오. 다음 표에는 각 필드에 지정할 필드와 값이 설명되어 있습니다.

    필드 설명 매핑 필드 데이터 유형 필터링 가능
    Amazon Bedrock은 데이터에서 원시 텍스트를 청크하고 청크를 이 필드에 저장합니다. 선택한 이름 (예:) text String True
    Amazon Bedrock은 이 분야의 지식 기반과 관련된 메타데이터를 저장합니다. 선택한 이름 (예:) bedrock-metadata String False
  8. 지식베이스를 만들 때 벡터 인덱스 이름, 벡터 필드 이름, 메타데이터 관리 매핑 필드 이름에 사용할 이름을 기록해 두십시오. 그런 다음 생성을 선택합니다.

벡터 색인을 만든 후 지식창고를 만들 수 있습니다. 다음 표에는 기록해 둔 각 정보를 입력할 위치가 요약되어 있습니다.

필드 지식 기반 설정의 해당 필드(콘솔) 지식 기반 설정의 해당 필드(API) 설명
모음 ARN 모음 ARN 컬렉션/ARN 벡터 검색 컬렉션의 Amazon 리소스 이름 (ARN).
벡터 인덱스 이름 벡터 인덱스 이름 vectorIndexName 벡터 인덱스의 이름.
벡터 필드 이름 벡터 필드 벡터 필드 데이터 소스의 벡터 임베딩을 저장할 필드의 이름.
메타데이터 관리 (첫 번째 매핑 필드) 텍스트 필드 텍스트 필드 데이터 소스의 원시 텍스트를 저장할 필드의 이름.
메타데이터 관리 (두 번째 매핑 필드) Bedrock에서 관리하는 메타데이터 필드 메타데이터 필드 Amazon Bedrock이 관리하는 메타데이터를 저장할 필드의 이름입니다.

Amazon OpenSearch Serverless에서 벡터 스토어를 설정하는 방법에 대한 자세한 설명서는 Amazon OpenSearch Service 개발자 안내서의 벡터 검색 컬렉션 사용을 참조하십시오.

Amazon Aurora
  1. Aurora PostgreSQL을 지식 기반으로 사용할 준비의 단계에 따라 Amazon Aurora 데이터베이스 (DB) 클러스터, 스키마 및 테이블을 생성하십시오. 테이블을 생성할 때 다음 열과 데이터 유형으로 구성하십시오. 다음 표에 나열된 이름 대신 원하는 열 이름을 사용할 수 있습니다. 지식 기반 설정 중에 입력할 수 있도록 선택한 열 이름을 기록해 둡니다.

    열 명칭 데이터 유형 지식 기반 설정의 해당 필드(콘솔) 지식 기반 설정의 해당 필드(API) 설명
    id UUID 프라이머리 키 프라이머리 키 primaryKeyField 각 레코드의 고유 식별자를 포함합니다.
    임베딩 벡터 벡터 필드 vectorField 데이터 소스의 벡터 임베딩을 포함합니다.
    덩어리 텍스트 텍스트 필드 textField 데이터 소스의 원시 텍스트 청크를 포함합니다.
    metadata JSON 기반이 관리하는 메타데이터 필드 metadataField 소스 속성을 가져오고 데이터 모으기 및 쿼리를 지원하는 데 필요한 메타데이터를 포함합니다.
  2. (선택 사항) 필터링을 위해 파일에 메타데이터를 추가한 경우 파일의 각 메타데이터 속성에 대한 열을 생성하고 데이터 유형 (텍스트, 숫자 또는 부울) 도 지정해야 합니다. 예를 들어, genre 속성이 데이터 원본에 있는 경우 이름을 genre 지정하고 데이터 text 유형으로 지정하는 열을 추가할 수 있습니다. 수집하는 동안 이러한 열은 해당 속성 값으로 채워집니다.

  3. Amazon AWS Secrets Manager Aurora를 사용한 암호 관리 및 단계에 따라 Aurora DB 클러스터의 암호를 구성하십시오. AWS Secrets Manager

  4. DB 클러스터를 생성하고 암호를 설정한 후에는 다음 정보를 기록해 둡니다.

    지식 기반 설정의 필드(콘솔) 지식 기반 설정의 필드(API) 설명
    Amazon Aurora DB 클러스터 ARN resourceArn DB 클러스터의 ARN 이름입니다.
    데이터베이스 이름 databaseName 데이터베이스의 이름입니다.
    테이블 이름 tableName DB 클러스터에서 테이블 이름
    보안 암호 ARN credentialsSecretArn DB 클러스터용 AWS Secrets Manager 키의 ARN
Pinecone
참고

를 사용하는 Pinecone 경우 벡터 스토어 서비스를 제공하기 위해 사용자를 대신하여 지정된 타사 소스에 액세스할 수 있는 권한을 부여하는 AWS 데 동의하는 것으로 간주됩니다. 귀하는 타사 서비스에서의 데이터 사용 및 전송에 적용되는 모든 타사 약관을 준수할 책임이 있습니다.

벡터 스토어를 설정하는 방법에 대한 자세한 설명서는 Amazon Pinecone Bedrock의 지식 베이스로서의 Pinecone을 참조하십시오.

벡터 저장소를 설정하는 동안, 지식 기반을 생성할 때 작성하게 될 다음과 같은 정보를 기록해 둡니다.

  • 연결 문자열 — 인덱스 관리 페이지의 엔드포인트 URL입니다.

  • 네임스페이스 - (선택 사항) 데이터베이스에 새 데이터를 쓰는 데 사용되는 네임스페이스입니다. 자세한 내용은 Using namespaces를 참조하세요.

인덱스를 만들 때 제공해야 하는 추가 구성이 있습니다. Pinecone

  • 이름 - 벡터 인덱스의 이름입니다. 원하는 유효한 이름을 선택합니다. 나중에 지식 기반을 생성할 때 벡터 인덱스 이름 필드에 선택한 이름을 입력합니다.

  • 차원 - 벡터의 차원 개수입니다. 다음 표를 참조하여 벡터에 포함해야 하는 차원 수를 결정하십시오.

    모델 차원
    TitanG1 임베딩 - 텍스트 1,536
    CohereEmbed영어 1,024
    CohereEmbed다국어 1,024
  • 거리 지표 - 벡터 간의 유사성을 측정하는 데 사용되는 지표입니다. 사용 사례에 따라 다양한 지표를 실험해 보는 것이 좋습니다. 코사인 유사성부터 시작하는 것이 좋습니다.

Pinecone인덱스에 액세스하려면 를 통해 Amazon Bedrock에 Pinecone API 키를 제공해야 합니다. AWS Secrets Manager

구성을 위한 암호를 설정하려면 Pinecone
  1. AWS Secrets Manager 시크릿 생성의 단계를 따라 키를 로, 값을 API 키로 apiKey 설정하여 Pinecone 인덱스에 액세스하세요.

  2. API 키를 찾으려면 Pinecone 콘솔을 열고 API 키를 선택합니다.

  3. 보안 암호를 생성한 후 KMS 키의 ARN을 기록해 둡니다.

  4. 지식 베이스가 들어 있는 벡터 스토어의 AWS Secrets Manager 비밀을 해독할 수 있는 권한의 단계에 따라 서비스 역할에 권한을 연결하여 KMS 키의 ARN을 복호화합니다.

  5. 나중에 지식 기반을 생성할 때 보안 인증 암호 ARN 필드에 ARN을 입력합니다.

Redis Enterprise Cloud
참고

를 사용하는 Redis Enterprise Cloud 경우 벡터 스토어 서비스를 제공하기 위해 사용자를 대신하여 지정된 타사 소스에 액세스할 수 있는 권한을 부여하는 AWS 데 동의하는 것으로 간주됩니다. 귀하는 제3자 서비스에서의 데이터 사용 및 전송에 적용되는 제3자 약관을 준수할 책임이 있습니다.

벡터 스토어를 설정하는 방법에 대한 자세한 설명서는 Amazon Redis Enterprise Cloud Bedrock과의 통합을 참조하십시오. Redis Enterprise Cloud

벡터 저장소를 설정하는 동안, 지식 기반을 생성할 때 작성하게 될 다음과 같은 정보를 기록해 둡니다.

  • 엔드포인트 URL — 데이터베이스의 퍼블릭 엔드포인트 URL입니다.

  • 벡터 인덱스 이름 — 데이터베이스의 벡터 인덱스 이름입니다.

  • 벡터 필드 — 벡터 임베딩이 저장될 필드의 이름입니다. 다음 표를 참조하여 벡터에 포함해야 하는 차원 수를 결정하십시오.

    모델 차원
    TitanG1 임베딩 - 텍스트 1,536
    CohereEmbed영어 1,024
    CohereEmbed다국어 1,024
  • 텍스트 필드 — Amazon Bedrock에서 원시 텍스트 청크를 저장하는 필드의 이름입니다.

  • Bedrock에서 관리하는 메타데이터 필드 — Amazon Bedrock이 지식창고와 관련된 메타데이터를 저장하는 필드의 이름입니다.

Redis Enterprise Cloud클러스터에 액세스하려면 를 통해 Amazon Bedrock에 Redis Enterprise Cloud 보안 구성을 제공해야 합니다. AWS Secrets Manager

구성을 위한 암호를 설정하려면 Redis Enterprise Cloud
  1. 전송 계층 보안(TLS)의 단계에 따라 TLS가 Amazon Bedrock과 함께 데이터베이스를 사용할 수 있도록 활성화합니다.

  2. AWS Secrets Manager 시크릿 생성의 단계를 따르세요. 시크릿의 Redis Enterprise Cloud 구성에서 적절한 값을 사용하여 다음 키를 설정합니다.

    • username— Redis Enterprise Cloud 데이터베이스에 접근하기 위한 사용자 이름. 사용자 이름을 찾으려면 Redis 콘솔에서 데이터베이스의 보안 섹션을 확인합니다.

    • password— Redis Enterprise Cloud 데이터베이스 액세스를 위한 암호. 암호를 찾으려면 Redis 콘솔에서 데이터베이스의 보안 섹션을 확인합니다.

    • serverCertificate - Redis Cloud 인증 기관에서 발급한 인증서의 내용입니다. Download certificates의 단계에 따라 Redis 관리 콘솔에서 서버 인증서를 다운로드합니다.

    • clientPrivateKey - Redis Cloud 인증 기관에서 발급한 인증서의 프라이빗 키입니다. Download certificates의 단계에 따라 Redis 관리 콘솔에서 서버 인증서를 다운로드합니다.

    • clientCertificate - Redis Cloud 인증 기관에서 발급한 인증서의 퍼블릭 키입니다. Download certificates의 단계에 따라 Redis 관리 콘솔에서 서버 인증서를 다운로드합니다.

  3. 보안 암호를 생성한 후 해당 ARN을 기록해 둡니다. 나중에 지식 기반을 생성할 때 보안 인증 암호 ARN 필드에 ARN을 입력합니다.

MongoDB Atlas
참고

MongoDB Atlas를 사용하는 경우 벡터 스토어 서비스를 제공하기 위해 사용자를 대신하여 지정된 타사 소스에 액세스할 수 있는 권한을 부여하는 AWS 데 동의하는 것으로 간주됩니다. 귀하는 타사 서비스에서의 데이터 사용 및 전송에 적용되는 모든 타사 약관을 준수할 책임이 있습니다.

MongoDB Atlas에서 벡터 스토어를 설정하는 방법에 대한 자세한 설명서는 Amazon Bedrock용 지식 베이스로 사용되는 MongoDB Atlas를 참조하십시오.

벡터 스토어를 설정할 때는 지식 베이스를 생성할 때 추가할 다음 정보를 참고하십시오.

  • 엔드포인트 URL — MongoDB 아틀라스 클러스터의 엔드포인트 URL입니다.

  • 데이터베이스 이름 - MongoDB Atlas 클러스터에 있는 데이터베이스의 이름입니다.

  • 컬렉션 이름 — 데이터베이스에 있는 컬렉션의 이름입니다.

  • 자격 증명 암호 ARN — AWS Secrets Manager에서 생성한 암호의 Amazon 리소스 이름 (ARN) 으로, MongoDB Atlas 클러스터에 있는 데이터베이스 사용자의 사용자 이름과 암호가 들어 있습니다.

  • (선택 사항) 자격 증명 보안 ARN용 고객 관리형 KMS 키 — 자격 증명 암호 ARN을 암호화한 경우 Amazon Bedrock에서 암호를 해독할 수 있도록 KMS 키를 제공하십시오.

MongoDB Atlas 인덱스를 생성할 때 제공해야 하는 필드 매핑에 대한 추가 구성이 있습니다.

  • 벡터 인덱스 이름 — 컬렉션에 있는 MongoDB Atlas 벡터 검색 인덱스의 이름입니다.

  • 벡터 필드 이름 — Amazon Bedrock이 벡터 임베딩을 저장해야 하는 필드의 이름입니다.

  • 텍스트 필드 이름 — Amazon Bedrock이 원시 청크 텍스트를 저장해야 하는 필드의 이름입니다.

  • 메타데이터 필드 이름 — Amazon Bedrock이 소스 어트리뷰션 메타데이터를 저장해야 하는 필드의 이름입니다.

(선택 사항) Amazon Bedrock을 PrivateLink AWS를 통해 MongoDB Atlas 클러스터에 연결하려면 Amazon Bedrock을 사용하는 MongoDB Atlas의 RAG 워크플로를 참조하십시오.