設定分割區索引爬蟲程式組態選項 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定分割區索引爬蟲程式組態選項

資料型錄支援分割區索引,以提供高效的特定分割區查閱。如需詳細資訊,請參閱在 AWS Glue中使用分割區索引。 AWS Glue 爬行者程式會根據不必要的方式為 Amazon S3 和達美湖目標建立分割區索引。

當您定義 cralwer 時,依預設會在 [設定輸出和排程] 頁面的 [進階選項] 下啟用 [自動建立分割區索引] 選項。

要禁用此選項,您可以取消選中複選框在控制台中自動創建分區索引。您也可以使用搜尋器 API 來停用此選項,CreatePartitionIndex 在中設定。Configuration預設值為 true。

分割區索引的使用說明

  • 依預設,爬蟲程式建立的資料表沒有變數 partition_filtering.enabled。如需詳細資訊,請參閱 AWS Glue 分割區索引和篩選

  • 不支援為加密分割區建立分割區索引。