Gmail - Amazon Kendra

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Gmail

Gmail은 Google에서 개발한 이메일 클라이언트로, 이를 통해 첨부 파일이 포함된 이메일 메시지를 보낼 수 있습니다. 폴더와 라벨을 사용하여 이메일 수신함 내에서 Gmail 메시지를 정렬하고 저장할 수 있습니다. 이메일 메시지 및 메시지 첨부파일을 Amazon Kendra 인덱싱하는 데 사용할 수 있습니다. 인덱싱할 특정 이메일 메시지, 메시지 첨부 파일 및 레이블을 포함하거나 Amazon Kendra 제외하도록 구성할 수도 있습니다.

Amazon Kendra 콘솔과 API를 사용하여 Gmail 데이터 소스에 연결할 Amazon Kendra 수 있습니다. TemplateConfiguration

Amazon Kendra Gmail 데이터 소스 커넥터 문제를 해결하려면 을 참조하십시오. 데이터 소스 문제 해결

지원되는 기능

  • 필드 매핑

  • 사용자 액세스 제어

  • 포함/제외 필터

  • 전체 및 점진적 콘텐츠 동기화

  • Virtual Private Cloud(VPC)

필수 조건

Gmail 데이터 소스의 색인을 생성하는 Amazon Kendra 데 사용하려면 먼저 Gmail과 계정에서 다음과 같이 변경하세요. AWS

Gmail에서 다음 사항을 갖추었는지 확인하세요.

  • Google Cloud Platform 관리자 계정을 만들고 Google Cloud 프로젝트를 생성했습니다.

  • 관리자 계정에서 Gmail API 및 관리자 SDK API를 활성화했습니다.

  • 서비스 계정을 만들고 Gmail용 JSON 프라이빗 키를 다운로드했습니다. 프라이빗 키를 만들고 액세스하는 방법에 대한 자세한 내용은 서비스 계정 키 생성서비스 계정 보안 인증 생성 방법에 대한 Google Cloud 설명서를 참조하세요.

  • 인증 자격 증명으로 사용할 관리자 계정 이메일, 서비스 계정 이메일, 비공개 키를 복사했습니다.

    참고

    보안 인증 정보와 보안 암호를 정기적으로 새로 고치거나 교체하는 것이 좋습니다. 보안을 위해 필요한 액세스 수준만 제공하세요. 데이터 소스, 커넥터 버전 1.0 및 2.0(해당하는 경우) 간에 보안 인증 정보와 보안 암호를 재사용하지 않는 것이 좋습니다.

  • 인덱싱하려는 사용자 및 공유 디렉터리에 대해 다음과 같은 Oauth 범위(관리자 역할 사용)를 추가했습니다.

    • https://www.googleapis.com/auth/admin.directory.user.readonly

    • https://www.googleapis.com/auth/gmail.readonly

  • Gmail 및 동일한 인덱스에 사용할 다른 여러 데이터 소스에서 각 문서가 고유한지 확인했습니다. 인덱스에 사용하려는 각 데이터 소스에는 데이터 소스 전체에서 동일한 문서가 포함되어서는 안 됩니다. 문서 ID는 인덱스 전체에 적용되며 인덱스별로 고유해야 합니다.

에 다음이 있는지 확인하십시오. AWS 계정

  • Amazon Kendra 색인을 만들고 API를 사용하는 경우 색인 ID를 기록해 두었습니다.

  • 데이터 소스에 대한 IAM 역할을 만들고 API를 사용하는 경우 역할의 IAM ARN을 기록했습니다.

    참고

    인증 유형과 자격 증명을 변경하는 경우 올바른 AWS Secrets Manager 비밀 ID에 액세스하려면 IAM 역할을 업데이트해야 합니다.

  • Gmail 보안 인증 정보를 AWS Secrets Manager 보안 암호에 저장했고 API를 사용하는 경우 보안 암호의 ARN을 기록했습니다.

    참고

    보안 인증 정보와 보안 암호를 정기적으로 새로 고치거나 교체하는 것이 좋습니다. 보안을 위해 필요한 액세스 수준만 제공하세요. 데이터 소스, 커넥터 버전 1.0 및 2.0(해당하는 경우) 간에 보안 인증 정보와 보안 암호를 재사용하지 않는 것이 좋습니다.

기존 IAM 역할이나 비밀번호가 없는 경우 Gmail 데이터 소스를 연결할 Amazon Kendra때 콘솔을 사용하여 새 IAM 역할과 Secrets Manager 비밀번호를 만들 수 있습니다. API를 사용하는 경우 기존 IAM 역할 및 Secrets Manager 암호의 ARN과 인덱스 ID를 제공해야 합니다.

연결 지침

Gmail 데이터 소스에 Amazon Kendra 연결하려면 데이터에 액세스할 Amazon Kendra 수 있도록 Gmail 자격 증명의 세부정보를 제공해야 합니다. 아직 Gmail을 구성하지 않았다면 을 Amazon Kendra참조하십시오. 필수 조건

Console

Gmail에 Amazon Kendra 연결하려면

  1. 에 AWS Management Console 로그인하고 Amazon Kendra 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 인덱스를 선택한 다음 인덱스 목록에서 사용할 인덱스를 선택합니다.

    참고

    인덱스 설정에서 사용자 액세스 제어 설정을 구성하거나 편집할 수 있습니다.

  3. 시작하기 페이지에서 데이터 소스 추가를 선택합니다.

  4. 데이터 소스 추가 페이지에서 Gmail 커넥터를 선택한 다음 커넥터 추가를 선택합니다. 버전 2 (해당하는 경우) 를 사용하는 경우 'V2.0' 태그가 있는 Gmail 커넥터를 선택하세요.

  5. 데이터 소스 세부 정보 지정 페이지에서 다음 정보를 입력합니다.

    1. 이름 및 설명에서 데이터 소스 이름에 데이터 소스의 이름을 입력합니다. 하이픈은 포함할 수 있지만 공백은 포함할 수 없습니다.

    2. (선택 사항) 설명 - 데이터 소스에 대한 선택적 설명을 입력합니다.

    3. 기본 언어 - 색인을 기준으로 문서를 필터링할 언어를 선택합니다. 달리 지정하지 않는 한, 언어는 영어로 기본 설정됩니다. 문서 메타데이터에 지정된 언어가 선택한 언어보다 우선합니다.

    4. 태그의 새 태그 추가 - 리소스를 검색 및 필터링하거나 비용을 추적할 수 있는 선택적 태그를 포함합니다. AWS

    5. 다음을 선택합니다.

  6. 액세스 및 보안 정의 페이지에서 다음 정보를 입력합니다.

    1. 승인 —ACL이 있고 액세스 제어에 사용하려는 경우 문서에 대한 액세스 제어 목록 (ACL) 정보를 켜거나 끕니다. ACL은 사용자와 그룹이 액세스할 수 있는 문서를 지정합니다. ACL 정보는 검색 결과를 문서에 대한 사용자 또는 그룹의 액세스 권한을 기준으로 필터링하는 데 사용됩니다. 자세한 내용은 사용자 컨텍스트 필터링을 참조하세요.

    2. 비밀번호 인증에서 - 기존 비밀번호를 선택하거나 새 Secrets Manager 비밀번호를 만들어 Gmail 인증 자격 증명을 저장합니다.AWS Secrets Manager 새 비밀번호를 만들기로 선택하면 AWS Secrets Manager 비밀 창이 열립니다.

      1. AWS Secrets Manager 보안 암호 생성 창에 다음 정보를 입력합니다.

        1. 보안 암호 이름 - 보안 암호의 이름.

        2. 클라이언트 이메일 - Google 서비스 계정에서 복사한 클라이언트 이메일.

        3. 관리자 계정 이메일 - 사용하려는 관리자 계정 이메일.

        4. 프라이빗 키 - Google 서비스 계정에서 복사한 프라이빗 키.

        5. 비밀번호를 저장하고 추가하세요.

    3. Virtual Private Cloud(VPC) - VPC를 사용하기로 선택할 수 있습니다. 그렇다면 서브넷VPC 보안 그룹을 추가해야 합니다.

    4. IAM 역할 - 기존 역할을 선택하거나 새 IAM IAM 역할을 생성하여 리포지토리 자격 증명에 액세스하고 콘텐츠를 인덱싱합니다.

      참고

      IAM 색인에 사용되는 역할은 데이터 원본에 사용할 수 없습니다. 기존 역할을 인덱스나 FAQ에 사용하는지 확실하지 않은 경우 새 역할 생성을 선택하여 오류를 방지하세요.

    5. 다음을 선택합니다.

  7. 동기화 설정 구성 페이지에 다음 정보를 입력합니다.

    1. 엔티티 유형의 경우 - 메시지 첨부 파일을 동기화하도록 선택합니다.

    2. (선택 사항) 추가 구성에서 다음 정보를 입력합니다.

      1. 날짜 범위 - 날짜 범위를 입력하여 크롤링하려는 이메일의 시작 날짜와 종료 날짜를 지정합니다.

      2. 이메일 도메인 - “받는 사람”, “보낸 사람”, “cc” 및 “bcc” 이메일 도메인을 기반으로 특정 이메일을 포함하거나 제외합니다.

      3. 제목의 키워드 - 이메일 제목의 키워드를 기준으로 이메일을 포함하거나 제외합니다.

        참고

        입력한 모든 주제 키워드와 일치하는 문서를 포함하도록 선택할 수도 있습니다.

      4. 레이블 - 정규 표현식 패턴을 추가하여 특정 이메일 레이블을 포함하거나 제외합니다.

      5. 첨부 파일 - 정규 표현식 패턴을 추가하여 특정 이메일 첨부 파일을 포함하거나 제외합니다.

    3. 동기화 모드 - 데이터 소스 콘텐츠가 변경될 때 인덱스를 업데이트하는 방법을 선택합니다. 데이터 원본을 처음으로 동기화하는 경우 기본적으로 모든 콘텐츠가 크롤링되고 인덱싱됩니다. Amazon Kendra 동기화 모드 옵션으로 전체 동기화를 선택하지 않더라도 초기 동기화에 실패한 경우 데이터의 전체 동기화를 실행해야 합니다.

      • 전체 동기화: 모든 콘텐츠를 새로 인덱싱하여 데이터 소스가 색인과 동기화될 때마다 기존 콘텐츠를 대체합니다.

      • 신규, 수정, 삭제된 동기화: 데이터 소스가 색인과 동기화될 때마다 신규, 수정, 삭제된 콘텐츠만 색인화합니다. Amazon Kendra 데이터 원본의 메커니즘을 사용하여 콘텐츠 변경 사항을 추적하고 마지막 동기화 이후 변경된 콘텐츠를 인덱싱할 수 있습니다.

      중요

      영구 삭제된 Gmail 메시지, 신규, 수정 또는 삭제된 콘텐츠 동기화를 업데이트하는 API가 없기 때문입니다.

      • Gmail에서 영구 삭제된 메일은 색인에서 삭제되지 않습니다. Amazon Kendra

      • Gmail 이메일 라벨의 변경사항을 동기화하지 않습니다.

      Gmail 데이터 소스 라벨 변경사항과 영구 삭제된 이메일 메시지를 Amazon Kendra 인덱스에 동기화하려면 정기적으로 전체 크롤링을 실행해야 합니다.

    4. 동기화 실행 일정에서 빈도 - 데이터 소스 콘텐츠를 동기화하고 색인을 업데이트하는 빈도를 선택합니다.

    5. 다음을 선택합니다.

  8. 필드 매핑 설정 페이지에 다음 정보를 입력합니다.

    1. 기본 데이터 원본 필드 - Amazon Kendra 생성된 기본 데이터 원본 필드 중에서 색인에 매핑하려는 필드를 선택합니다.

      참고

      Amazon Kendra Gmail 데이터 소스 커넥터는 API 제한으로 인해 맞춤 색인 필드 생성을 지원하지 않습니다.

    2. 다음을 선택합니다.

  9. 검토 및 생성 페이지에서 입력한 정보가 정확한지 확인한 다음 데이터 소스 추가를 선택합니다. 이 페이지에서 정보를 편집하도록 선택할 수도 있습니다. 데이터 소스가 성공적으로 추가된 후 데이터 소스 페이지에 데이터 소스가 표시됩니다.

API

Gmail에 Amazon Kendra 연결하려면

TemplateConfiguration API를 사용하여 데이터 소스 스키마의 JSON을 지정해야 합니다. 다음 정보를 제공해야 합니다.

  • 데이터 소스 - TemplateConfigurationJSON 스키마를 사용할 GMAIL 때와 같이 데이터 소스 유형을 지정합니다. 또한 API를 TEMPLATE 호출할 때와 같이 데이터 소스를 지정하십시오. CreateDataSource

  • 동기화 모드 - 데이터 소스 콘텐츠가 변경될 때 색인을 업데이트하는 방법을 Amazon Kendra 지정합니다. 데이터 원본을 처음으로 동기화하는 경우 기본적으로 모든 콘텐츠가 크롤링되고 색인됩니다. Amazon Kendra 동기화 모드 옵션으로 전체 동기화를 선택하지 않더라도 초기 동기화에 실패한 경우 데이터의 전체 동기화를 실행해야 합니다. 다음 중에서 선택할 수 있습니다.

    • FORCED_FULL_CRAWL모든 콘텐츠를 새로 인덱싱하려면 데이터 원본이 색인과 동기화될 때마다 기존 콘텐츠를 교체해야 합니다.

    • FULL_CRAWL데이터 원본이 색인과 동기화될 때마다 새 콘텐츠, 수정된 콘텐츠, 삭제된 콘텐츠만 인덱싱합니다. Amazon Kendra 데이터 원본의 메커니즘을 사용하여 콘텐츠 변경 사항을 추적하고 마지막 동기화 이후 변경된 콘텐츠를 인덱싱할 수 있습니다.

    중요

    영구 삭제된 Gmail 메시지, 신규, 수정 또는 삭제된 콘텐츠 동기화를 업데이트하는 API가 없기 때문입니다.

    • Gmail에서 영구 삭제된 메일은 색인에서 삭제되지 않습니다. Amazon Kendra

    • Gmail 이메일 라벨의 변경사항을 동기화하지 않습니다.

    Gmail 데이터 소스 라벨 변경사항과 영구 삭제된 이메일 메시지를 Amazon Kendra 색인에 동기화하려면 정기적으로 전체 크롤링을 실행해야 합니다.

  • 비밀 Amazon 리소스 이름 (ARN) - Gmail 계정의 인증 자격 증명이 포함된 Secrets Manager 비밀의 Amazon 리소스 이름 (ARN) 을 입력합니다. 보안 암호는 다음 키가 있는 JSON 구조로 저장됩니다.

    { "adminAccountEmailId": "service account email", "clientEmailId": "user account email", "privateKey": "private key" }
  • IAM 역할 - CreateDataSource Secrets Manager 비밀에 액세스할 권한을 가진 IAM 역할을 제공하고 Gmail 커넥터 및 Gmail 커넥터에 필요한 공개 API를 호출하기 위해 호출할 RoleArn 시기를 지정합니다. Amazon Kendra자세한 내용은 Gmail 데이터 소스에 대한IAM 역할을 참조하세요.

다음 선택적 기능도 추가할 수 있습니다.

  • Virtual Private Cloud(VPC) - CreateDataSource를 호출할 때 VpcConfiguration을 지정합니다. 자세한 정보는 를 사용하도록 Amazon Kendra 구성하기 Amazon VPC을 참조하세요.

  • 포함 및 제외 필터 - 특정 “받는 사람”, “보낸 사람”, “cc”, “bcc” 이메일을 포함할지 아니면 제외할지를 지정합니다.

    참고

    대부분의 데이터 소스는 필터라고 하는 포함 또는 제외 패턴인 정규 표현식 패턴을 사용합니다. 포함 필터를 지정하는 경우 포함 필터와 일치하는 콘텐츠만 인덱싱됩니다. 포함 필터와 일치하지 않는 문서는 인덱싱되지 않습니다. 포함 및 제외 필터를 지정하는 경우 제외 필터와 일치하는 문서는 포함 필터와 일치하더라도 인덱싱되지 않습니다.

  • 사용자 컨텍스트 필터링 및 액세스 제어 — 문서에Amazon Kendra ACL이 있는 경우 문서에 대한 액세스 제어 목록 (ACL) 을 크롤링합니다. ACL 정보는 검색 결과를 문서에 대한 사용자 또는 그룹의 액세스 권한을 기준으로 필터링하는 데 사용됩니다. 자세한 내용은 사용자 컨텍스트 필터링을 참조하세요.

  • 필드 매핑 - Gmail 데이터 소스 필드를 Amazon Kendra 인덱스 필드에 매핑하기로 선택합니다. 자세한 내용을 알아보려면 데이터 소스 필드 매핑을 참조하세요.

    참고

    문서를 Amazon Kendra 검색하려면 문서에 해당하는 문서 본문 필드 또는 문서 본문 필드가 필요합니다. 데이터 원본의 문서 본문 필드 이름을 색인 필드 이름에 매핑해야 _document_body 합니다. 다른 모든 필드는 선택 사항입니다.

    참고

    Amazon Kendra Gmail 데이터 소스 커넥터는 API 제한으로 인해 맞춤 색인 필드 생성을 지원하지 않습니다.

구성해야 할 기타 중요한 JSON 키 목록은 Gmail 템플릿 스키마를 참조하세요.

자세히 알아보기

Gmail 데이터 Amazon Kendra 소스와의 통합에 대해 자세히 알아보려면 다음을 참조하세요.

참고

  • 영구 삭제된 Gmail 메시지를 업데이트하는 API가 없으므로 FULL_CRAWL/새 콘텐츠, 수정 콘텐츠, 삭제된 콘텐츠가 동기화됩니다.

    • Gmail에서 영구 삭제된 메일은 색인에서 삭제되지 않습니다. Amazon Kendra

    • Gmail 이메일 라벨의 변경사항을 동기화하지 않습니다.

    Gmail 데이터 소스 라벨 변경사항과 영구 삭제된 이메일 메시지를 Amazon Kendra 색인에 동기화하려면 정기적으로 전체 크롤링을 실행해야 합니다.

  • Amazon Kendra Gmail 데이터 소스 커넥터는 API 제한으로 인해 맞춤 색인 필드 생성을 지원하지 않습니다.