데이터 소스 문제 해결 - Amazon Kendra

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 소스 문제 해결

이 섹션은 구성 및 사용 시 발생하는 일반적인 문제를 해결하는 데 도움이 될 수 있습니다. Amazon Kendra 데이터 소스 커넥터.

내 문서가 인덱싱되지 않았습니다.

동기화할 때 Amazon Kendra 데이터 소스와 색인을 생성하면 문서가 색인되지 않는 문제가 발생할 수 있습니다. 인덱싱은 두 단계로 이루어져 있습니다. 먼저 데이터 소스에서 인덱스를 생성할 새 문서 및 업데이트된 문서가 있는지 확인하고 인덱스에서 제거할 문서를 찾습니다. 둘째, 문서 수준에서 각 문서에 액세스하고 인덱싱합니다.

두 단계 중 하나에서 오류가 발생할 수 있습니다. 데이터 소스 수준 오류는 콘솔의 데이터 소스 세부정보 페이지의 동기화 실행 기록 섹션에 보고됩니다. 동기화 작업의 상태는 성공, 미완료 또는 실패일 수 있습니다. 또한 작업 중에 인덱싱되고 삭제된 문서 수를 볼 수 있습니다. 상태가 실패인 경우 세부 정보 열에 메시지가 표시됩니다.

문서 수준 오류는 에서 보고됩니다. Amazon CloudWatch Logs. 다음을 사용하여 오류를 확인할 수 있습니다. CloudWatch 콘솔.

문서 동기화 상태 보고서를 생성하려면 내 문서에 대한 동기화 상태 보고서를 생성하고자 함을 참조하세요.

동기화 작업이 실패함

동기화 작업은 일반적으로 인덱스 또는 데이터 소스에 구성 오류가 있는 경우 실패합니다. 콘솔의 세부 정보 열 아래에 있는 데이터 소스 세부 정보 페이지의 동기화 실행 기록 섹션에서 오류 메시지를 찾을 수 있습니다. 문서 수준 오류는 에서 보고됩니다. Amazon CloudWatch Logs. 오류 메시지는 무엇이 잘못되었는지에 대한 정보를 제공합니다. 일반적으로 문제는 인덱스나 데이터 원본에 적절한 인덱스나 데이터 원본이 없다는 것입니다. IAM 권한. 오류 메시지에 누락된 권한이 설명되어 있습니다. 수신할 수 있는 몇 가지 오류 메시지는 다음과 같습니다.

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

인덱스 역할에 사용 권한이 없는 경우 CloudWatch, 데이터 원본은 새 데이터를 만들 수 없습니다. CloudWatch 로그. 이 오류가 발생하면 다음을 추가해야 합니다. CloudWatch 인덱스 역할에 대한 권한.

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

를 사용하는 경우 Amazon S3 데이터 소스, Amazon Kendra 문서가 포함된 버킷에 액세스할 수 있는 권한이 있어야 합니다. 에 대한 권한을 추가해야 합니다. Amazon Kendra 버킷을 데이터 원본으로 읽으려면 IAM 역할.

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra 인덱스 및 데이터 소스를 위임하려면 권한이 필요합니다. IAM 역할. sts:AssumeRole 작업에 대한 권한이 있는 역할에 신뢰 정책을 추가해야 합니다.

를 위해 IAM 다음과 같은 정책 Amazon Kendra 데이터 소스를 인덱싱해야 합니다. 참조 IAM 역할.

문서 동기화 상태 보고서를 생성하려면 내 문서에 대한 동기화 상태 보고서를 생성하고자 함을 참조하세요.

동기화 작업이 완료되지 않음

데이터 소스 수준 프로세스를 완료했지만 문서 수준 프로세스에서 약간의 오류가 발생한 경우, 작업은 일반적으로 완료되지 않습니다. 작업이 완료되지 않은 경우 일부 문서의 인덱스가 제대로 생성되지 않았을 수 있습니다. 남자용 Amazon S3 데이터 원본의 불완전한 작업은 일반적으로 다음과 같은 원인으로 발생합니다.

  • 하나 이상의 문서에 대한 메타데이터가 잘못되었습니다.

  • 인덱싱을 위해 문서를 제출했지만 하나 이상의 문서가 제출되지 않은 경우.

  • 인덱스에서 삭제하기 위해 문서를 제출했지만 하나 이상의 문서가 제출되지 않은 경우.

불완전한 동기화 작업의 문제를 해결하려면 먼저 다음을 확인하십시오. CloudWatch 로그.

  1. 세부 정보 열에서 세부 정보 보기를 선택합니다. CloudWatch.

  2. 오류 메시지를 검토하여 문서 오류의 원인을 확인하세요.

문서 동기화 상태 보고서를 생성하려면 내 문서에 대한 동기화 상태 보고서를 생성하고자 함을 참조하세요.

동기화 작업은 성공했지만 인덱싱된 문서가 없음

인덱스 동기화 작업 실행이 성공한 것으로 표시되지만 예상했던 인덱싱된 새 문서나 업데이트된 문서가 없는 경우가 있습니다. 가능한 이유는 다음과 같습니다.

  • Check]를 선택합니다 CloudWatch DocumentsSubmittedForIndexingFailed지표로 동기화에 실패한 문서가 있는지 확인할 수 있습니다. 다음을 확인하세요. CloudWatch 로그에서 자세한 내용을 확인하세요.

  • ... 의 경우 Amazon S3 데이터 소스는 다음과 같이 제공했을 수 있습니다. Amazon Kendra 잘못된 버킷 이름 또는 접두사. 버킷이 다음을 충족하는지 확인하십시오. Amazon Kendra 사용 중인 것은 인덱싱할 문서가 들어 있는 문서입니다.

  • 이전 작업에서 인덱싱하지 못한 문서를 다시 인덱싱하는 경우 Amazon Kendra 문서 또는 관련 메타데이터 파일을 변경하지 않는 한 인덱싱하지 않습니다.

문서 동기화 상태 보고서를 생성하려면 내 문서에 대한 동기화 상태 보고서를 생성하고자 함을 참조하세요.

데이터 소스를 동기화하는 동안 파일 형식 문제가 발생함

데이터 원본에 파일을 추가하거나 데이터 원본을 동기화하는 동안 파일 형식 문제가 발생하는 경우 문서 유형이 다음과 같은지 확인하세요. Amazon Kendra 지원됩니다. 에서 지원하는 문서 유형 목록은 다음과 같습니다. Amazon Kendra 문서 유형 또는 형식을 참조하십시오.

를 일반 텍스트 파일과 BatchPutDocument API 함께 사용하는 경우 콘텐츠 유형으로 PLAIN_TEXT 지정하십시오.

내 문서에 대한 동기화 기록 보고서를 생성하고자 함

보고서 보기를 선택하여 데이터 소스 동기화 작업에 CloudWatch 대한 문서 수준 동기화 실행 기록 보고서를 볼 수 있습니다. 동기화 실행 기록 보고서에는 동기화 작업에 있는 각 문서의 진행 상황 및 상태에 대한 세부 정보가 포함됩니다. 크롤링, 동기화 및 인덱스 단계에서 문서가 성공했는지, 실패했는지 또는 건너뛰었는지 보여줍니다. 또한 실패하거나 건너뛰었던 문서와 관련된 오류 메시지도 찾을 수 있습니다. 보고서에 진행 중인 동기화 작업의 결과가 표시되지 않는 경우 로그를 아직 사용할 수 없을 수 있습니다. 동기화 프로세스 중에 이벤트가 발생하면 보고서로 데이터가 전송되므로 나중에 다시 확인해 보세요.

동기화 실행 기록 보고서에 액세스하려면 다음 단계를 따르세요.

  1. 에서 Amazon Kendra 콘솔을 엽니다. https://console.aws.amazon.com/kendra/

  2. 왼쪽 탐색 메뉴의 데이터 관리에서 데이터 소스를 선택한 다음 데이터 소스를 선택합니다.

  3. 데이터 원본 요약 페이지에서 아래로 스크롤하여 동기화 기록 탭을 선택합니다.

  4. 동기화 실행 기록에서 작업을 선택합니다.

  5. 작업에서 보고서 보기를 선택합니다. 보고서에 액세스할 수 있는 CloudWatch 콘솔로 리디렉션됩니다.

참고

동기화 실행 기록은 모든 Amazon Kendra 지원 커넥터에 대해 첨부 파일 ACLs 및 메타데이터를 포함하여 통합 중에 문서가 성공적으로 인덱싱되었는지 여부를 기록합니다.

Amazon S3 커넥터를 사용하는 경우:

에서 문서 수준 동기화 실행 기록 보고서를 보는 것 외에도 Amazon S3 데이터 소스의 CloudWatch 각 문서에 대한 동기화 기록 보고서를 생성하여 다음 주소로 복사할 수 있습니다. Amazon S3 버킷. 이 과정에서 데이터는 다음을 사용하여 암호화됩니다. AWS KMS 키는 본인만 볼 수 있습니다. 보고된 문서 상태는 실패, 완료 또는 성공(오류 있음) 중 하나일 수 있습니다. Amazon S3에 대한 동기화 상태 보고서를 생성하려면 먼저 다음을 수행해야 합니다.

  • 다음을 추가하세요. Amazon Kendra 서비스 주체를 귀하의 담당자에게 Amazon S3 액세스 정책

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • 생성하기 Amazon S3 에 대한 액세스 권한이 있는 버킷 Amazon Kendra

콘솔을 사용하는 경우 Amazon S3에 대한 동기화 기록 보고서를 생성하려면 데이터 소스 세부 정보 페이지의 동기화 기록 보고서 — 선택 사항 섹션에서 보고서 생성 옵션을 활성화하도록 선택합니다. 그런 다음 다음을 입력합니다. Amazon S3 버킷 위치를 선택하고 사용 가능한 구성 옵션 중에서 선택합니다. 보고서 생성을 활성화하면 다음번 동기화에서 보고서가 생성됩니다.

삭제하면 Amazon S3 버킷은 로그 데이터를 잃게 되며 새 동기화 보고서를 저장하려면 새 버킷을 설정해야 합니다.

참고

동기화 기록 보고서는 Amazon S3 커넥터가 데이터를 성공적으로 크롤링하고 수집했는지 여부에 대한 정보만 제공합니다.

데이터 소스를 동기화하는 데 시간이 얼마나 걸리나요?

문서가 업데이트되지 않은 경우 동기화 시간은 다음과 같습니다. Amazon Kendra 인덱스는 문서 수에 비례하여 선형적으로 증가합니다. 예를 들어 업데이트가 없는 문서 1,000개는 동기화하는 데 약 5분이 걸리고, 업데이트가 없는 문서 2,000개는 동기화하는 데 약 10분이 걸립니다. 문서가 업데이트된 경우 업데이트된 문서 수에 따라 동기화 시간이 늘어납니다.

데이터 소스를 동기화하는 데 드는 요금은 얼마인가요?

색인을 동기화할 때 워밍업 및 활성화하는 데 2분이 걸립니다. Amazon EC2 필요한 연결을 설정합니다. 이 프로세스에는 요금이 청구되지 않습니다. 사용량 측정기는 동기화 작업이 시작된 후에만 시작됩니다. 에 대한 자세한 내용은 Amazon Kendra 가격 책정은 다음을 참조하십시오. Amazon Kendra 가격 책정 .

하나 받고 있어요 Amazon EC2 인증 오류가 발생했습니다.

만약 Amazon EC2 가상 사설 클라우드 (VPC) 데이터 소스를 동기화하는 동안 무단 작동 오류가 발생하는 경우 다음과 같은 문제가 발생할 수 있습니다. VPC IAM 역할에 필요한 권한이 없습니다. 다음 사항을 확인해 주세요. IAM 데이터 원본에 사용하는 역할에는 첨부된 권한이 있습니다. 자세한 내용은 가상 사설 클라우드를 참조하십시오. IAM 역할.

귀하의 Amazon Kendra 색인은 다음과 같은 파일에만 액세스할 수 있습니다. Amazon S3 데이터 소스는 액세스 권한을 부여합니다. 예: Amazon Kendra 수정할 수 없습니다. Amazon S3 객체가 공개용인지 암호화되어야 하는지를 결정하는 권한. Amazon Kendra 또한 서명된 링크를 만들거나 반환할 수 있는 기본 권한이 없습니다. Amazon S3 객체. 에 대한 서명된 링크를 활성화하려는 경우 Amazon S3 a에 있는 객체 Amazon Kendra 색인에는 두 가지 옵션이 있습니다.

  • 결과를 검색 페이지에 반환하기 전에 소스 uri 객체를 사용하여 인덱스 쿼리 결과에 서명할 수 있습니다. 이 프로세스에 대한 step-by-step 자세한 내용은 presigned를 사용한 객체 공유를 참조하십시오. URLs

  • 다음을 재정의할 수 있습니다. Amazon S3 객체 메타데이터 소스 uri를 통해 서비스를 사용할 수 있도록 합니다. CloudFront 에 연결된 콘텐츠 전송 네트워크 (CDN) Amazon S3 버킷. 또는 다음을 사용할 수 있습니다. API Gateway 미리 서명된 항목을 URL 반환하고 해당 주소로 리디렉션하는 프록시 엔드포인트.

SSL인증서 파일 사용 AccessDenied 시 오류 메시지가 나타납니다.

데이터 원본과 함께 SSL 인증서를 사용할 때 액세스 거부 오류가 발생하는 경우 다음 사항을 확인하십시오. IAM 역할에는 지정된 위치에 있는 SSL 인증서 파일에 액세스할 수 있는 권한이 있습니다. 인증서가 다음으로 암호화된 경우 AWS KMS 키, 귀하의 IAM 역할에는 다음을 사용하여 암호를 해독할 수 있는 권한도 있어야 합니다. AWS KMS 키. 자세한 내용은 인증 및 액세스 제어를 참조하십시오. AWS KMS.

SharePoint 데이터 원본을 사용할 때 권한 부여 오류가 발생합니다.

색인을 SharePoint 데이터 원본과 동기화하는 동안 권한 부여 오류가 발생하는 경우 사이트 관리자 역할이 할당되었는지 확인하세요. SharePoint

내 인덱스가 Confluence 데이터 소스의 문서를 크롤링하지 않음

다음과 같은 경우 Amazon Kendra 동기화 프로세스 중에 색인이 Confluence 데이터 원본의 문서를 크롤링하지 않는 경우 사용자가 Confluence의 관리자 그룹에 속해 있는지 확인하세요.