先决条件
-
要从中读取内容的 Okta 对象。请参阅下面的支持的实体表,查看可用的实体。
支持的实体
实体 | 可以筛选 | 支持限制 | 支持排序依据 | 支持 Select * | 支持分区 |
---|---|---|---|---|---|
应用程序 | 支持 | 是 | 否 | 是 | 否 |
设备 | 支持 | 是 | 否 | 是 | 是 |
组 | 支持 | 是 | 是 | 是 | 是 |
Users | 支持 | 是 | 是 | 是 | 是 |
用户类型 | 否 | 否 | 否 | 是 | 否 |
示例
okta_read = glueContext.create_dynamic_frame.from_options(
connection_type="Okta",
connection_options={
"connectionName": "connectionName",
"ENTITY_NAME": "applications",
"API_VERSION": "v1"
}
Okta 实体和字段详细信息
实体列表:
-
Application:https://developer.okta.com/docs/api/openapi/okta-management/management/tag/Application/
-
Device:https://developer.okta.com/docs/api/openapi/okta-management/management/tag/Device/
-
Group:https://developer.okta.com/docs/api/openapi/okta-management/management/tag/Group/
-
User:https://developer.okta.com/docs/api/openapi/okta-management/management/tag/User/
-
User Type:https://developer.okta.com/docs/api/openapi/okta-management/management/tag/UserType/
对查询进行分区
如果您想在 Spark 中利用并发,可以提供附加 Spark 选项 PARTITION_FIELD
、LOWER_BOUND
、UPPER_BOUND
和 NUM_PARTITIONS
。使用这些参数,原始查询将被拆分为 NUM_PARTITIONS
个子查询,这些子查询可以由 Spark 任务同时执行。
-
PARTITION_FIELD
:用于对查询进行分区的字段的名称。 -
LOWER_BOUND
:所选分区字段的包含下限值。对于日期,我们接受 Spark SQL 查询中使用的 Spark 日期格式。有效值示例:
"2024-02-06"
。 -
UPPER_BOUND
:所选分区字段的排除上限值。 -
NUM_PARTITIONS
:分区的数量。
示例
okta_read = glueContext.create_dynamic_frame.from_options(
connection_type="okta",
connection_options={
"connectionName": "connectionName",
"ENTITY_NAME": "lastUpdated",
"API_VERSION": "v1",
"PARTITION_FIELD": "lastMembershipUpdated"
"LOWER_BOUND": "2022-08-10T10:28:46.000Z"
"UPPER_BOUND": "2024-08-10T10:28:46.000Z"
"NUM_PARTITIONS": "10"
}