기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
PostgreSQL
PostgreSQL는 오픈 소스 데이터베이스 관리 시스템입니다. PostgreSQL 사용자인 경우 Amazon Kendra 를 사용하여 PostgreSQL 데이터 소스를 인덱싱할 수 있습니다. 데이터 소스 커넥터는 Amazon Kendra PostgreSQL PostgreSQL 9.6을 지원합니다.
Amazon Kendra 콘솔
데이터 소스 커넥터 문제 해결은 섹션을 참조하세요 Amazon Kendra PostgreSQL데이터 소스 문제 해결.
지원 기능
-
필드 매핑
-
사용자 컨텍스트 필터링
-
포함/제외 필터
-
전체 및 증분 콘텐츠 동기화
-
Virtual Private Cloud(VPC)
사전 조건
Amazon Kendra 를 사용하여 PostgreSQL 데이터 소스를 인덱싱하려면 먼저 PostgreSQL 및 AWS 계정에서 이러한 변경을 수행합니다.
PostgreSQL에서 다음 사항을 갖추었는지 확인하세요.
-
데이터베이스 사용자 이름 및 암호를 기록했습니다.
중요
가장 좋은 방법은 Amazon Kendra 에 읽기 전용 데이터베이스 자격 증명을 제공하는 것입니다.
-
데이터베이스 호스트 URL, 포트, 인스턴스를 복사했습니다.
-
PostgreSQL 및 동일한 인덱스에 사용할 다른 여러 데이터 소스에서 각 문서가 고유한지 확인했습니다. 인덱스에 사용하려는 각 데이터 소스에는 데이터 소스 전체에서 동일한 문서가 포함되어서는 안 됩니다. 문서 ID는 인덱스 전체에 적용되며 인덱스별로 고유해야 합니다.
에서 다음 사항을 확인해야 AWS 계정합니다.
-
Amazon Kendra 인덱스를 생성하고 API를 사용하는 경우 인덱스 ID를 기록했습니다.
-
데이터 소스에 대한 IAM 역할을 생성하고 API를 사용하는 경우 IAM 역할의 ARN을 기록했습니다.
참고
인증 유형과 자격 증명을 변경하는 경우 올바른 AWS Secrets Manager 보안 암호 ID에 액세스하도록 IAM 역할을 업데이트해야 합니다.
-
PostgreSQL 보안 인증 정보를 AWS Secrets Manager 보안 암호에 저장했고 API를 사용하는 경우 보안 암호의 ARN을 기록했습니다.
참고
보안 인증 정보와 보안 암호를 정기적으로 새로 고치거나 교체하는 것이 좋습니다. 보안을 위해 필요한 액세스 수준만 제공하세요. 데이터 소스, 커넥터 버전 1.0 및 2.0(해당하는 경우) 간에 보안 인증 정보와 보안 암호를 재사용하지 않는 것이 좋습니다.
기존 IAM 역할이나 보안 암호가 없는 경우 PostgreSQL 데이터 소스를 연결할 때 콘솔을 사용하여 새 IAM 역할 및 Secrets Manager 보안 암호를 생성할 수 있습니다 Amazon Kendra. API를 사용하는 경우 기존 IAM 역할 및 Secrets Manager 보안 암호의 ARN과 인덱스 ID를 제공해야 합니다.
연결 지침
PostgreSQL 데이터 소스 Amazon Kendra 에 연결하려면가 데이터에 액세스할 Amazon Kendra 수 있도록 PostgreSQL 자격 증명의 세부 정보를 제공해야 합니다. 아직에 PostgreSQL 대해를 구성하지 않은 경우 섹션을 Amazon Kendra 참조하세요사전 조건.
Amazon Kendra 에 연결하려면 PostgreSQL
-
에 로그인 AWS Management Console 하고 Amazon Kendra 콘솔
을 엽니다. -
왼쪽 탐색 창에서 인덱스를 선택한 다음 인덱스 목록에서 사용할 인덱스를 선택합니다.
참고
인덱스 설정에서 사용자 액세스 제어 설정을 구성하거나 편집할 수 있습니다.
-
시작하기 페이지에서 데이터 소스 추가를 선택합니다.
-
데이터 소스 추가 페이지에서 PostgreSQL 커넥터를 선택한 다음 커넥터 추가를 선택합니다. 버전 2(해당하는 경우)를 사용하는 경우 "V2.0" 태그가 있는 PostgreSQL 커넥터를 선택합니다.
-
데이터 소스 세부 정보 지정 페이지에서 다음 정보를 입력합니다.
-
이름 및 설명에서 데이터 소스 이름에 데이터 소스의 이름을 입력합니다. 하이픈은 포함할 수 있지만 공백은 포함할 수 없습니다.
-
(선택 사항) 설명 - 데이터 소스에 대한 선택적 설명을 입력합니다.
-
기본 언어 - 문서를 인덱스로 필터링할 언어를 선택합니다. 달리 지정하지 않는 한, 언어는 영어로 기본 설정됩니다. 문서 메타데이터에 지정된 언어가 선택한 언어보다 우선합니다.
-
태그에서 새 태그 추가 - 리소스를 검색 및 필터링하거나 AWS 비용을 추적하는 선택적 태그를 포함합니다.
-
Next(다음)를 선택합니다.
-
-
액세스 및 보안 정의 페이지에서 다음 정보를 입력합니다.
-
소스에서 다음 정보를 입력합니다.
-
호스트 - 데이터베이스 호스트 이름을 입력합니다.
-
포트 - 데이터베이스 포트를 입력합니다.
-
인스턴스 - 데이터베이스 인스턴스를 입력합니다.
-
SSL 인증서 위치 활성화 - SSL 인증서 파일의 Amazon S3 경로를 입력하도록 선택합니다.
-
인증에서 - 다음 정보를 입력합니다.
-
AWS Secrets Manager 보안 암호 - 기존 보안 암호를 선택하거나 새 Secrets Manager 보안 암호를 생성하여 PostgreSQL 인증 자격 증명을 저장합니다. 새 암호를 만들기로 선택하면 AWS Secrets Manager 보안 암호 창이 열립니다.
-
AWS Secrets Manager 보안 암호 생성 창에 다음 정보를 입력합니다.
-
보안 암호 이름 - 보안 암호의 이름. 'Amazon Kendra-PostgreSQL-'라는 접두사가 보안 암호 이름에 자동으로 추가됩니다.
-
데이터베이스 사용자 이름 및 암호의 경우 - 데이터베이스에서 복사한 보안 인증 값을 입력합니다.
-
-
저장(Save)을 선택합니다.
-
-
-
Virtual Private Cloud(VPC) - VPC를 사용하기로 선택할 수 있습니다. 그렇다면 서브넷과 VPC 보안 그룹을 추가해야 합니다.
-
IAM 역할 - 기존 IAM 역할을 선택하거나 새 IAM 역할을 생성하여 리포지토리 자격 증명 및 인덱스 콘텐츠에 액세스합니다.
참고
IAM 인덱스에 사용되는 역할은 데이터 소스에 사용할 수 없습니다. 기존 역할을 인덱스나 FAQ에 사용하는지 확실하지 않은 경우 새 역할 생성을 선택하여 오류를 방지하세요.
-
Next(다음)를 선택합니다.
-
-
동기화 설정 구성 페이지에 다음 정보를 입력합니다.
-
동기화 범위에서 다음 옵션을 선택합니다.
-
SQL 쿼리 - SELECT 및 JOIN 연산과 같은 SQL 쿼리 문을 입력합니다. SQL 쿼리는 32KB 미만이어야 합니다. Amazon Kendra 는 쿼리와 일치하는 모든 데이터베이스 콘텐츠를 크롤링합니다.
-
프라이머리 키 열 - 데이터베이스 테이블의 프라이머리 키를 입력합니다. 이는 데이터베이스 내의 테이블을 식별합니다.
-
제목 열 - 데이터베이스 테이블에 있는 문서 제목 열의 이름을 입력합니다.
-
본문 열 - 데이터베이스 테이블 내의 문서 본문 열 이름을 제공합니다.
-
-
추가 구성 - 선택 사항에서 모든 파일을 동기화하는 대신 다음 옵션 중 하나를 선택하여 특정 콘텐츠를 동기화합니다.
-
열 변경 감지 - 콘텐츠 변경을 감지하는 데 Amazon Kendra 사용할 열의 이름을 입력합니다.는 이러한 열에 변경 사항이 있을 때 콘텐츠를 다시 인덱싱 Amazon Kendra 합니다.
-
사용자 ID 열 - 콘텐츠에 대한 액세스를 허용할 사용자 ID가 포함된 열의 이름을 입력합니다.
-
그룹 열 - 콘텐츠에 대한 액세스를 허용할 그룹이 포함된 열의 이름을 입력합니다.
-
소스 URL 열 - 인덱싱할 소스 URL이 포함된 열의 이름을 입력합니다.
-
타임스탬프 열 - 타임스탬프가 포함된 열의 이름을 입력합니다. 타임스탬프 정보를 Amazon Kendra 사용하여 콘텐츠의 변경 사항을 감지하고 변경된 콘텐츠만 동기화합니다.
-
시간대 열 - 콘텐츠를 크롤링할 시간대가 포함된 열의 이름을 입력합니다.
-
타임스탬프 형식 - 콘텐츠 변경 사항을 감지하고 콘텐츠를 다시 동기화하는 데 사용할 타임스탬프 형식이 포함된 열의 이름을 입력합니다.
-
-
동기화 모드 - 데이터 소스 콘텐츠가 변경될 때 인덱스를 업데이트하는 방법을 선택합니다. 데이터 소스를 Amazon Kendra 와 처음 동기화하면 기본적으로 모든 콘텐츠가 크롤링되고 인덱싱됩니다. 동기화 모드 옵션으로 전체 동기화를 선택하지 않은 경우에도 초기 동기화가 실패한 경우 데이터의 전체 동기화를 실행해야 합니다.
-
전체 동기화: 데이터 소스가 인덱스와 동기화될 때마다 기존 콘텐츠를 대체하여 모든 콘텐츠를 새로 인덱싱합니다.
-
새로운 수정된 동기화: 데이터 소스가 인덱스와 동기화될 때마다 새 콘텐츠와 수정된 콘텐츠만 인덱싱합니다. Amazon Kendra 는 데이터 소스의 메커니즘을 사용하여 콘텐츠 변경 사항을 추적하고 마지막 동기화 이후 변경된 콘텐츠를 인덱싱할 수 있습니다.
-
신규, 수정, 삭제된 동기화: 데이터 소스가 인덱스와 동기화될 때마다 신규, 수정 및 삭제된 콘텐츠만 인덱싱합니다.는 데이터 소스의 메커니즘을 사용하여 콘텐츠 변경 사항을 추적하고 마지막 동기화 이후 변경된 콘텐츠를 인덱싱할 Amazon Kendra 수 있습니다.
-
-
동기화 실행 일정의 빈도 - Amazon Kendra 가 데이터 소스와 동기화할 빈도를 선택합니다.
-
Next(다음)를 선택합니다.
-
-
필드 매핑 설정 페이지에 다음 정보를 입력합니다.
-
생성된 기본 데이터 소스 필드인 문서 IDs, 문서 제목 및 소스 URLs 중에서 Amazon Kendra 인덱스에 매핑하려는 필드를 선택합니다.
-
필드 추가 - 사용자 지정 데이터 소스 필드를 추가하려면 매핑할 인덱스 필드 이름과 필드 데이터 유형을 만듭니다.
-
Next(다음)를 선택합니다.
-
-
검토 및 생성 페이지에서 입력한 정보가 정확한지 확인한 다음 데이터 소스 추가를 선택합니다. 이 페이지에서 정보를 편집하도록 선택할 수도 있습니다. 데이터 소스가 성공적으로 추가된 후 데이터 소스 페이지에 데이터 소스가 표시됩니다.
Notes
-
가 업데이트된 콘텐츠를 Amazon Kendra 확인할 때 삭제된 데이터베이스 행은 추적되지 않습니다.
-
데이터베이스 행의 필드 이름 및 값 크기는 400KB를 초과할 수 없습니다.
-
데이터베이스 데이터 소스에 많은 양의 데이터가 있고 첫 번째 동기화 후 모든 데이터베이스 콘텐츠를 인덱싱하지 않으 Amazon Kendra 려면 새 문서, 수정된 문서 또는 삭제된 문서만 동기화하도록 선택할 수 있습니다.
-
가장 좋은 방법은 Amazon Kendra 에 읽기 전용 데이터베이스 자격 증명을 제공하는 것입니다.
-
가장 좋은 방법은 민감한 데이터나 개인 식별 정보(PII)가 포함된 테이블을 추가하지 않는 것입니다.