本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
SharePoint 连接器 V2.0
SharePoint 是一项协作建站服务,可用于自定义 Web 内容以及创建页面、网站、文档库和列表。您可以使用 Amazon Kendra 为 SharePoint 数据源编制索引。
Amazon Kendra 目前支持 SharePoint 在线版和 SharePoint服务器版(2013 年、2016 年、2019 年和订阅版)。
注意
SharePoint 连接器 V1.0/ SharePointConfiguration API 于 2023 年结束。我们建议迁移到或使用 SharePoint 连接器 V2.0/ TemplateConfiguration API。
要对 Amazon Kendra SharePoint 数据源连接器进行故障排除,请参阅数据来源故障排除。
支持的特征
Amazon Kendra SharePoint 数据源连接器支持以下功能:
-
字段映射
-
用户访问控制
-
包含/排除筛选条件
-
完整内容和增量内容同步
-
Virtual Private Cloud (VPC) [虚拟私有云(VPC)]
先决条件
在使用索 Amazon Kendra 引 SharePoint 数据源之前,请在 SharePoint 和 AWS 帐户中进行这些更改。
您需要提供身份验证凭证,这些凭据可以安全地存储在 AWS Secrets Manager 密钥中。
注意
我们建议您定期刷新或轮换您的凭证和密码。为了安全起见,请仅提供必要的访问权限级别。我们建议不要跨数据来源以及连接器版本 1.0 和 2.0(如果适用)重复使用凭证和密钥。
在 “在 SharePoint 线” 中,请确保你有:
-
已复制您的 SharePoint 实例 URLs。您输入的主机 URL 的格式为
https://yourdomain.sharepoint.com/sites/mysite
。您的 URL 必须以https
开头并包含sharepoint.com
。 -
已复制您的 SharePoint 实例 URL 的域名。
-
已记下您的基本身份验证凭据,其中包含用户名和密码,具有连接到 On SharePoint line 的站点管理员权限。
-
使用管理用户在 Azure 门户中停用安全默认值。有关在 Azure 门户中管理安全默认设置的更多信息,请参阅 Microsoft 关于如何启用/禁用安全默认设置的文档
。 -
已在您的 SharePoint账户中停用多因素身份验证 (MFA),这样就不会阻止 Amazon Kendra 它抓取您的内容。 SharePoint
-
如果使用基本身份验证以外的身份验证类型:已复制 SharePoint 实例的租户 ID。有关如何查找租户 ID 的详细信息,请参阅查找您的 Microsoft 365 租户 ID
。 -
如果你需要使用 Microsoft Entra 迁移到云用户身份验证,请参阅微软关于云身份验证的文档
。 -
对于 OAuth 2.0 身份验证和 OAuth 2.0 刷新令牌身份验证:记下您的基本身份验证凭据,其中包含用于连接到 On SharePoint line 的用户名和密码以及注册 SharePoint 到 Azure AD 后生成的客户端 ID 和客户端密钥。
-
如果您未使用 ACL,请添加以下权限:
Microsoft Graph SharePoint -
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
AllSites.Read(委托)-读取所有网站集中的项目
注意
Note.Read.All 和 Sites.Read.All 只有在你想抓取 Documents 时才是必填的。 OneNote
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个 API 权限,你需要通过 Microsoft Graph API 明确设置每个网站的访问权限。有关更多信息,请参阅 Microsoft 有关 Sites.Selected 权限的博客
。 -
-
如果您使用 ACL,请添加以下权限:
Microsoft Graph SharePoint -
Group.Member.Read.All(应用程序)- 读取所有组成员资格
-
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
站点。 FullControl.All(已授权)-检索文档所必需 ACLs 的
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
User.Read.All(应用程序)- 读取所有用户的完整个人资料
-
AllSites.Read(委托)-读取所有网站集中的项目
注意
GroupMember只有激活 Identity Crawler 时,才需要.Read.All 和 User.Read.All。
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个 API 权限,你需要通过 Microsoft Graph API 明确设置每个网站的访问权限。有关更多信息,请参阅 Microsoft 有关 Sites.Selected 权限的博客
。 -
-
-
对于 Azure AD 仅限应用程序的身份验证:私钥和注册 SharePoint 到 Azure AD 后生成的客户端 ID。还要注意 X.509 证书。
-
如果您未使用 ACL,请添加以下权限:
SharePoint -
Sites.Read.All(应用程序)-需要访问所有网站集中的项目和列表
注意
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个 API 权限,你需要通过 Microsoft Graph API 明确设置每个网站的访问权限。有关更多信息,请参阅 Microsoft 有关 Sites.Selected 权限的博客
。 -
-
如果您使用 ACL,请添加以下权限:
SharePoint -
站点。 FullControl.All(应用程序)-检索文档所必需 ACLs 的
注意
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个 API 权限,你需要通过 Microsoft Graph API 明确设置每个网站的访问权限。有关更多信息,请参阅 Microsoft 有关 Sites.Selected 权限的博客
。 -
-
-
对于 SharePoint 仅限应用程序的身份验证:记下在授予 “仅限 SharePoint 应用程序” 权限时生成的客户端 ID 和客户端密钥,以及向 Azure AD 注册 SharePoint 应用程序时生成的客户端 ID 和客户端密钥。 SharePoint
注意
SharePoint SharePoint 2013 版本不支持仅限应用程序的身份验证。
-
(可选)如果您正在搜索 OneNote文档并使用 Id entity Crawler,请添加以下权限:
Microsoft Graph -
GroupMember.Read.All(应用程序)-读取所有群组成员资格
-
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
User.Read.All(应用程序)- 读取所有用户的完整个人资料
-
注意
使用基本身份验证和仅限 SharePoint应用程序的身份验证来抓取实体不需要 AP I 权限。
-
在 SharePoint Server 中,请确保你有:
-
已复制您的 SharePoint 实例 URLs 和您的域名 SharePoint URLs。您输入的主机 URL 的格式为
https://yourcompany/sites/mysite
。您的 URL 必须以https
开头。注意
(本地/服务器) Amazon Kendra 会检查中 AWS Secrets Manager 包含的端点信息是否与数据源配置详细信息中指定的端点信息相同。这有助于防止出现混淆代理人问题,这是一个安全问题,即用户无权执行操作,但可以将 Amazon Kendra 作为代理来访问配置的密钥和执行操作。如果以后更改端点信息,则必须创建一个新密钥来同步此信息。
-
已在您的 SharePoint账户中停用多因素身份验证 (MFA),这样就不会阻止 Amazon Kendra 它抓取您的内容。 SharePoint
-
如果使用SharePoint 仅限应用程序的身份验证进行访问控制:
-
已复制您在站点级别注册 “仅限应用程序” 时生成的 SharePoint 客户端 ID。客户端 ID 格式为 ClientId @ TenantId。例如,
ffa956f3-8f89-44e7-b0e4-49670756342c@888d0b57-69f1-4fb8-957f-e1f0bedf82fe
。 -
已复制您在站点级别注册 “仅限应用程序” 时生成的 SharePoint 客户端密钥。
注意:由于只有在注册 SharePoint 服务器进行仅限应用程序身份验证时,才会为单个站点生成客户端 IDs 和客户端密钥,因此仅 SharePoint 应用程序身份验证仅支持一个站点 URL。
注意
SharePoint SharePoint 2013 版本不支持仅限应用程序的身份验证。
-
-
如果使用带有自定义域名的电子邮件 ID 进行访问控制:
-
记下了您的自定义电子邮件域值,例如:“”。
amazon.com
-
-
如果使用带有来自 IDP 的域名的电子邮件 ID 身份验证,请复制您的:
-
LDAP 服务器端点(LDAP 服务器的端点,包括协议和端口号)。例如:
ldap://example.com:389
。 -
LDAP 搜索库(LDAP 用户的搜索库)。例如:
CN=Users,DC=sharepoint,DC=com
。 -
LDAP 用户名和 LDAP 密码。
-
-
要么配置了 NTLM 身份验证凭据,要么配置了包含用户名(SharePoint 帐户用户名)和密码(SharePoint 帐户密码)的 Kerberos 身份验证凭据。
在你的 AWS 账户,请确保你有:
-
已创建 Amazon Kendra 索引,如果使用 API,则记下索引 ID。
-
为您的数据源@@ 创建了一个 IAM 角色,如果使用 API,请记下该角色的 ARN。 IAM
注意
如果您更改了身份验证类型和证书,则必须更新您的 IAM 角色才能访问正确的 AWS Secrets Manager 密钥 ID。
-
将您的 SharePoint 身份验证凭证存储在 AWS Secrets Manager 密钥中,如果使用 API,请记下该密钥的 ARN。
注意
我们建议您定期刷新或轮换您的凭证和密码。为了安全起见,请仅提供必要的访问权限级别。我们建议不要跨数据来源以及连接器版本 1.0 和 2.0(如果适用)重复使用凭证和密钥。
如果您没有现有的 IAM 角色或密钥,则可以在将 SharePoint 数据源连接到时使用控制台创建新的 IAM 角色和 Secrets Manager 密钥 Amazon Kendra。如果您使用的是 API,则必须提供现有 IAM 角色和 Secrets Manager 密钥的 ARN 以及索引 ID。
连接说明
要 Amazon Kendra 连接到您的 SharePoint 数据源,您必须提供 SharePoint 凭据的详细信息, Amazon Kendra 以便访问您的数据。如果您尚未进行配置, SharePoint 请参 Amazon Kendra 阅先决条件。
备注
-
连接器仅支持文件实体的自定义字段映射。
-
对于所有 SharePoint 服务器版本,ACL 令牌必须为小写。对于包含来自 IDP 的域名和带有自定义域 ACL 的电子邮件 ID 的电子邮件,例如:
user@sharepoint2019.com
。对于具有域 ACL 的域\ 用户,例如:sharepoint2013\user
。 -
连接器不支持 SharePoint 2013 年的更改日志模式/ 新内容或修改内容同步。
-
如果实体名称中包含字
%
符,则由于 API 限制,连接器将跳过这些文件。 -
OneNote 只能由连接器使用租户 ID 进行抓取,并激活了 OAuth 2.0、 OAuth 2.0 刷新令牌或仅限 SharePoint 应用程序的身份验证 SharePoint 。
-
连接器仅使用 OneNote 文档的默认名称抓取文档的第一部分,即使文档已重命名也是如此。
-
连接器会抓取 SharePoint 2019 年、 SharePoint在线版和订阅版中的链接,前提是除了链接之外还选择 “页面” 和 “文件” 作为要抓取的实体。
-
如果选择链接作为要抓取的实体,则连接器会在 SharePoint SharePoint 2013 年和 2016 年抓取链接。
-
仅当列表数据也被选为要爬取的实体时,连接器才会爬取列表附件和评论。
-
仅当事件也被选为要爬取的实体时,连接器才会爬取事件附件。
-
对于 SharePoint 在线版本,ACL 令牌将使用小写。例如,如果用户主体名称位于 Azure 门户
MaryMajor@domain.com
中,则 SharePoint 连接器中的 ACL 令牌将是marymajor@domain.com
。 -
在 Identity Crawler f or O SharePoint nline 和 Server 中,如果要抓取嵌套群组,则必须激活本地和 AD 组抓取。
-
如果你使用的是 O SharePoint nline,并且 Azure 门户中的用户主体名称是大写和小写的组合,那么 SharePoint API 会在内部将其转换为小写。因此, Amazon Kendra SharePoint 连接器以小写形式设置 ACL。