기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Microsoft SharePoint는 문서, 웹 페이지, 웹 사이트, 목록 등을 작업하기 위한 웹 기반 공동 작업 서비스입니다. Amazon BedrockAWS 용 관리 콘솔 또는 CreateDataSource API를 사용하여 Amazon Bedrock
참고
Microsoft SharePoint 데이터 소스는 테이블, 차트, 다이어그램 또는 기타 이미지와 같은 멀티모달 데이터를 지원하지 않습니다.
Amazon Bedrock은 SharePoint Online 인스턴스에 대한 연결을 지원합니다. OneNote 문서 크롤링은 현재 지원되지 않습니다. 현재는 Amazon OpenSearch Serverless 벡터 저장소만 이 데이터 소스와 함께 사용할 수 있습니다.
크롤링할 수 있는 파일 수와 파일당 MB 크기에는 제한이 있습니다. Quotas for knowledge bases를 참조하세요.
지원 기능
-
기본 문서 필드 자동 감지
-
포함/제외 콘텐츠 필터
-
추가, 업데이트, 삭제된 콘텐츠에 대한 증분 콘텐츠 동기화
-
SharePoint 앱 전용 인증
사전 조건
SharePoint(온라인)
SharePoint(온라인)에서 SharePoint 앱 전용 인증을 사용하기 위한 다음 단계를 완료합니다.
-
SharePoint Online 사이트 URL/URL을 적어 둡니다. (예:
https://yourdomain.sharepoint.com/sites/mysite
) URL은https
로 시작하고sharepoint.com
을 포함해야 합니다. 사이트 URL은sharepoint.com/
또는site/mysite/home.aspx
가 아닌 실제 SharePoint 사이트여야 합니다. -
SharePoint Online 인스턴스 URL/URL의 도메인 이름을 적어 둡니다.
-
Microsoft 365 테넌트 ID를 복사합니다. 테넌트 ID는 Microsoft Entra 포털의 속성에서 찾을 수 있습니다. 자세한 내용은 Microsoft 365 테넌트 ID 찾기를 참조하세요
. 참고
예제 애플리케이션은 Microsoft Learn 웹 사이트의 Register a client application in Microsoft Entra ID
(이전 명칭: Azure Active Directory)을 참조하세요. -
SharePoint 앱 전용 자격 증명을 구성합니다.
-
SharePoint App-Only에 권한을 부여할 때 클라이언트 ID 및 클라이언트 보안 암호 값을 복사합니다. 자세한 내용은 SharePoint App-Only를 사용하여 액세스 권한 부여를 참조하세요
. 참고
SharePoint App-Only에 대한 API 권한을 설정할 필요가 없습니다.
AWS 계정
AWS 계정에서 다음을 확인합니다.
-
인증 자격 증명 정보를 AWS Secrets Manager 보안 암호에 저장하고 보안 암호의 Amazon 리소스 이름(ARN)을 메모해 둡니다. 이 페이지의 연결 구성 지침에 따라 보안 암호에 포함되어야 하는 키-값 페어를 포함합니다.
-
지식 기반에 대한 AWS Identity and Access Management (IAM) 역할/권한 정책에 데이터 소스에 연결하는 데 필요한 권한을 포함합니다. 이 데이터 소스가 지식 기반 IAM 역할에 추가하는 데 필요한 권한에 대한 자세한 내용은 데이터 소스에 액세스할 수 있는 권한을 참조하세요.
참고
콘솔을 사용하는 경우 AWS Secrets Manager 로 이동하여 보안 암호를 추가하거나 데이터 소스 구성 단계의 일부로 기존 보안 암호를 사용할 수 있습니다. 지식 기반을 생성하기 위한 콘솔 단계의 일부로 필요한 모든 권한이 있는 IAM 역할을 생성할 수 있습니다. 데이터 소스 및 기타 구성을 구성한 후에는 필요한 모든 권한이 있는 IAM 역할이 특정 지식 기반에 적용됩니다.
보안 인증 정보와 보안 암호를 정기적으로 새로 고치거나 교체하는 것이 좋습니다. 보안을 위해 필요한 액세스 수준만 제공하세요. 데이터 소스 전체에서 자격 증명 및 보안 암호를 재사용하는 것은 권장하지 않습니다.
연결 구성
SharePoint 인스턴스에 연결하려면 필요한 구성 정보를 제공해야만 Amazon Bedrock이 데이터에 액세스하고 크롤링할 수 있습니다. 또한 사전 조건를 따라야 합니다.
이 데이터 소스에 대한 구성의 예제가 이 섹션에 포함되어 있습니다.
문서 필드의 자동 감지, 포함/제외 필터, 증분 동기화, 보안 인증 자격 증명 및 이러한 작업의 작동 방식에 대해 알아보려면 아래에서 관련 항목을 선택하세요.
데이터 소스 커넥터는 문서 또는 콘텐츠의 모든 기본 메타데이터 필드를 자동으로 감지하고 크롤링합니다. 예를 들어, 데이터 소스 커넥터는 문서, 문서 제목, 문서 생성 또는 수정 날짜, 또는 문서에 적용될 수 있는 기타 핵심 필드에 해당하는 문서 본문을 크롤링할 수 있습니다.
중요
콘텐츠에 민감한 정보가 포함된 경우는 민감한 정보를 사용하여 응답 Amazon Bedrock 할 수 있습니다.
메타데이터 필드에 필터링 연산자를 적용하여 응답 관련성을 더욱 개선할 수 있습니다. 예를 들어, 문서의 'epoch_modification_time' 또는 문서가 마지막으로 업데이트된 1970년 1월 1일 이후의 초 수가 있습니다. 'epoch_modification_time'이 특정 수보다 큰 최신 데이터를 기준으로 필터링할 수 있습니다. 메타데이터 필드에 적용할 수 있는 필터링 연산자에 대한 자세한 내용은 Metadata and filtering을 참조하세요.
특정 콘텐츠 크롤링을 포함하거나 제외할 수 있습니다. 예를 들어, 제외 접두사/정규 표현식 패턴을 지정하여 파일 이름에 ‘private’이 포함된 파일의 크롤링을 건너뛸 수 있습니다. 특정 콘텐츠 엔터티 또는 콘텐츠 유형을 포함하도록 포함 접두사/정규 표현식 패턴을 지정할 수도 있습니다. 포함 및 제외 필터를 지정하고 둘 모두가 문서와 일치하는 경우, 제외 필터가 우선하며 문서가 크롤링되지 않습니다.
파일 이름에 ‘private’이 포함된 PDF 파일을 제외하거나 필터링하는 정규식 패턴의 예시는 ".*private.*\\.pdf"입니다.
다음 콘텐츠 유형에 포함/제외 필터를 적용할 수 있습니다.
-
Page
: 기본 페이지 제목 -
Event
: 이벤트 이름 -
File
: 첨부 파일 및 모든 문서 파일의 파일 이름(확장자 포함)
OneNote 문서 크롤링은 현재 지원되지 않습니다.
데이터 소스 커넥터는 데이터 소스가 지식 기반과 동기화될 때마다 새 콘텐츠, 수정된 콘텐츠 및 삭제된 콘텐츠를 크롤링합니다.는 데이터 소스의 메커니즘을 사용하여 콘텐츠 변경을 추적하고 마지막 동기화 이후 변경된 콘텐츠를 크롤링할 Amazon Bedrock 수 있습니다. 데이터 소스를 처음으로 지식 기반과 동기화하는 경우 기본적으로 모든 콘텐츠가 동기화됩니다.
데이터 소스를 지식 기반과 동기화하려면 StartIngestionJob API를 사용하거나 콘솔에서 지식 기반을 선택하고 데이터 소스 개요 섹션에서 동기화를 선택합니다.
중요
데이터 소스에서 동기화하는 모든 데이터는 데이터를 검색할 수 있는 bedrock:Retrieve
권한이 있는 모든 사용자에게 제공됩니다. 여기에는 제어된 데이터 소스 권한이 있는 모든 데이터가 포함될 수 있습니다. 자세한 내용은 Knowledge base permissions를 참조하세요.
SharePoint 앱 전용 인증을 사용하는 경우의 보안 인증 자격 증명에는 다음과 같은 키-값 페어가 포함되어야 AWS Secrets Manager 합니다.
-
clientId
:Microsoft Entra SharePoint 애플리케이션과 연결된 클라이언트 ID
-
clientSecret
:Microsoft Entra SharePoint 애플리케이션과 연결된 클라이언트 보안 암호
-
sharePointClientId
:앱 전용 인증을 위해 SharePoint 앱을 등록할 때 생성된 클라이언트 ID
-
sharePointClientSecret
:앱 전용 인증을 위해 SharePoint 앱을 등록할 때 생성된 클라이언트 보안 암호
참고
의 보안 암호는 지식 기반과 동일한 리전을 사용해야 AWS Secrets Manager 합니다.
지식 기반에 SharePoint 인스턴스 연결
-
의 단계에 따라 SharePoint를 데이터 소스로 Amazon Bedrock 지식 기반에서 데이터 소스에 연결하여 지식 기반 생성 선택합니다.
-
데이터 소스의 이름과 선택적 설명을 제공합니다.
-
SharePoint 사이트 URL/URL을 제공합니다. 예를 들어 SharePoint Online의 경우
https://yourdomain.sharepoint.com/sites/mysite
와 같은 형식입니다. URL은https
로 시작하고sharepoint.com
을 포함해야 합니다. 사이트 URL은sharepoint.com/
또는site/mysite/home.aspx
가 아닌 실제 SharePoint 사이트여야 합니다. -
SharePoint 인스턴스의 도메인 이름을 제공합니다.
-
고급 설정 섹션에서 선택적으로 다음을 구성할 수 있습니다.
-
임시 데이터 스토리지용 KMS 키입니다. - 데이터를 기본 AWS 관리형 키 또는 자체 KMS 키를 사용하여 임베딩으로 변환하는 동안 임시 데이터를 암호화할 수 있습니다. 자세한 내용은 데이터 모으기 중 임시 데이터 스토리지의 암호화 단원을 참조하십시오.
-
데이터 삭제 정책 - 기본적으로 벡터 스토어에 저장된 데이터 소스의 벡터 임베딩을 삭제하거나 벡터 스토어 데이터를 보존하도록 선택할 수 있습니다.
-
-
SharePoint 인스턴스에 연결할 인증 정보를 제공합니다. SharePoint 앱 전용 인증의 경우:
-
테넌트 ID를 제공합니다. Azure Active Directory 포털의 속성에서 테넌트 ID를 찾을 수 있습니다.
-
AWS Secrets Manager 로 이동하여 보안 암호 자격 증명을 추가하거나 생성한 보안 암호에 기존 Amazon 리소스 이름(ARN)을 사용합니다. 보안 암호에는 테넌트 수준 또는 사이트 수준에서 앱 전용을 등록할 때 생성된 SharePoint 클라이언트 ID와 SharePoint 클라이언트 보안 암호, 앱을 Entra에 등록할 때 생성된 Entra 클라이언트 ID와 Entra 클라이언트 보안 암호가 포함되어야 합니다.
-
-
(선택 사항) 콘텐츠 구문 분석 및 청킹 섹션에서 데이터를 구문 분석하고 청킹하는 방법을 사용자 지정할 수 있습니다. 이러한 사용자 지정에 대해 자세히 알아보려면 다음 리소스를 참조하세요.
-
구문 분석 옵션에 대한 자세한 내용은 섹션을 참조하세요데이터 소스에 대한 구문 분석 옵션.
-
청킹 전략에 대한 자세한 내용은 섹션을 참조하세요지식 기반에서 콘텐츠 청킹의 작동 방식.
주의
데이터 소스에 연결한 후에는 청킹 전략을 변경할 수 없습니다.
-
Lambda 함수를 사용하여 데이터 청킹 및 메타데이터 처리를 사용자 지정하는 방법에 대한 자세한 내용은 섹션을 참조하세요사용자 지정 변환 Lambda 함수를 사용하여 데이터 수집 방법 정의.
-
-
필터/정규 표현식 패턴을 사용하여 특정 콘텐츠를 포함하거나 제외하도록 선택합니다. 선택하지 않으면 모든 표준 콘텐츠가 크롤링됩니다.
-
임베딩 모델 및 벡터 스토어를 계속 선택합니다. 나머지 단계를 보려면 로 돌아가Amazon Bedrock 지식 기반에서 데이터 소스에 연결하여 지식 기반 생성서 데이터 소스를 연결한 후 단계에서 계속합니다.
중요
OAuth2.0 인증은 권장되지 않습니다. SharePoint 앱 전용 인증을 사용하는 것이 좋습니다.
OAuth 2.0을 사용하면 지식 기반과 통합된 SharePoint 커넥터의 SharePoint 리소스에 대한 액세스를 인증하고 승인할 수 있습니다.
필수 조건
SharePoint에서 OAuth 2.0 인증의 경우 다음을 확인합니다.
-
SharePoint Online 사이트 URL/URL을 적어 둡니다. (예:
https://yourdomain.sharepoint.com/sites/mysite
) URL은https
로 시작하고sharepoint.com
을 포함해야 합니다. 사이트 URL은sharepoint.com/
또는site/mysite/home.aspx
가 아닌 실제 SharePoint 사이트여야 합니다. -
SharePoint Online 인스턴스 URL/URL의 도메인 이름을 적어 둡니다.
-
Microsoft 365 테넌트 ID를 복사합니다. 테넌트 ID는 Microsoft Entra 포털의 속성 또는 OAuth 애플리케이션에서 찾을 수 있습니다.
관리자 SharePoint 계정의 사용자 이름과 암호를 기록해 두고 애플리케이션을 등록할 때 클라이언트 ID와 클라이언트 보안 암호 값을 복사합니다.
참고
예제 애플리케이션은 Microsoft Learn 웹 사이트의 Register a client application in Microsoft Entra ID
(이전 명칭: Azure Active Directory)을 참조하세요. -
애플리케이션을 등록할 때 SharePoint에 연결하려면 특정 읽기 권한이 필요합니다.
-
SharePoint: AllSites.read (위임) - 모든 사이트 모음의 항목 읽기
-
-
관리자 사용자를 통해 Azure 포털에서 보안 기본값을 해제해야 할 수 있습니다. Azure Portal에서 보안 기본 설정을 관리하는 방법에 대한 자세한 내용은 보안 기본값을 활성화/비활성화하는 방법에 대한 Microsoft 설명서
를 참조하세요. -
Amazon Bedrock이 SharePoint 콘텐츠를 크롤링하지 못하도록 SharePoint 계정에서 다중 인증(MFA)을 꺼야 할 수 있습니다.
사전 조건을 완료하려면의 단계를 완료했는지 확인합니다AWS 계정.
보안 인증 자격 증명
OAuth2.0,에 대한 연결 구성의 경우에 설명된 대로 기본 문서 필드, 포함/제외 필터 및 증분 동기화의 자동 감지에 대해 동일한 단계를 수행할 수 있습니다연결 구성.
OAuth 2.0 인증의 경우의 보안 인증 자격 증명에 이러한 키-값 페어가 포함되어야 AWS Secrets Manager 합니다.
-
username
:SharePoint 관리자 사용자 이름
-
password
:SharePoint 관리자 암호
-
clientId
:OAuth 앱 클라이언트 ID
-
clientSecret
:OAuth 앱 클라이언트 보안 암호
지식 기반에 SharePoint 인스턴스 연결
OAuth2.0을 사용할 때 SharePoint 인스턴스를 지식 기반에 연결하려면: OAuth2.0:
-
(콘솔) 콘솔에서 SharePoint 인스턴스를 지식 기반에 연결에 설명된 것과 동일한 단계를 따릅니다. SharePoint 인스턴스에 연결할 인증 정보를 제공하려는 경우.
-
테넌트 ID를 제공합니다. Azure Active Directory 포털의 속성에서 테넌트 ID를 찾을 수 있습니다.
-
AWS Secrets Manager 로 이동하여 보안 인증 자격 증명을 추가하거나 생성한 보안 암호에 기존 Amazon 리소스 이름(ARN)을 사용합니다. 보안 암호에는 SharePoint 관리자 사용자 이름과 암호, 등록된 앱 클라이언트 ID 및 클라이언트 보안 암호가 포함되어야 합니다. 예제 애플리케이션은 Microsoft Learn 웹 사이트의 Register a client application in Microsoft Entra ID
(이전 명칭: Azure Active Directory)을 참조하세요.
-
-
(API) 다음은
CreateDataSource
API를 사용하여 OAuth2.0.aws bedrock-agent create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE"
sharepoint-bedrock-connector-configuration.json
의 콘텐츠{ "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }