本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
連線參數
下表詳細說明每個資料存放區 AWS Glue 連線支援的 Python 屬性。
Amazon Redshift 連線參數
Amazon Redshift 的連線支援下列 Python AWS Glue 連線參數。
金錀 | Type | 描述 | 限制 | 必要 |
---|---|---|---|---|
auto_create |
類型:boolean |
指出是否應建立不存在的使用者。預設為 false 。 |
true , false |
否 |
aws_secret_arn |
類型:string |
用來擷取連線之其他參數的秘密 ARN。 | 有效的 ARN | 否 |
cluster_identifier |
類型:string - maxLength:63 |
Amazon Redshift 叢集的叢集識別碼。 | ^(?!.*—)【a-z】【a-z0-9-】{0,61}【a-z0-9】$ | 否 |
database |
類型:string - maxLength:127 |
要連線到之資料庫的名稱。 | 否 | |
database_metadata_current_db_only |
類型:boolean |
指出應用程式是否支援多資料庫資料共用目錄。預設為 ,true 表示應用程式不支援多資料庫資料共用目錄,以實現回溯相容性。 |
true , false |
否 |
db_groups |
類型:string |
以逗號分隔的現有資料庫群組名稱清單, db_user 會加入目前工作階段。 |
否 | |
db_user |
類型:string |
要與 Amazon Redshift 搭配使用的使用者 ID。 | 否 | |
host |
類型:string - maxLength:256 |
Amazon Redshift 叢集的主機名稱。 | 否 | |
iam |
類型:boolean |
為連線啟用或停用 IAM 型身分驗證的旗標。預設為 false 。 |
true , false |
否 |
iam_disable_cache |
類型:boolean |
此選項會指定是否快取 IAM 憑證。預設為 true 。當對於 API 閘道的請求遭到限流時,這可以提高效能。 |
true , false |
否 |
max_prepared_statements |
類型:integer |
一次可開啟的已備妥陳述式數量上限。 | 否 | |
numeric_to_float |
要浮動的十進位 | 指定是否將從小數轉換NUMERIC 資料類型值。根據預設,系統會將NUMERIC 值接收為 decimal.Decimal Python 物件。對於偏好最精確的使用案例,不建議啟用此選項,因為結果可能會四捨五入。啟用此選項float 之前,請參閱 上的 Python 文件decimal.Decimal decimal.Decimal 和 之間的權衡。預設為 false 。 |
true , false |
否 |
port |
類型:integer |
Amazon Redshift 叢集的連接埠號碼。 | 範圍 1150-65535 | 否 |
profile |
類型:string - maxLength:256 |
包含 使用的登入資料和設定的設定檔名稱 AWS CLI。 | 否 | |
region |
類型:string |
叢集所在的 AWS 區域。 | 有效 AWS 區域 | 否 |
serverless_acct_id |
類型:string - maxLength:256 |
與 Amazon Redshift 無伺服器資源相關聯的 AWS 帳戶 ID。 | 否 | |
serverless_work_group |
類型:string - maxLength:256 |
Amazon Redshift 無伺服器端點的工作群組名稱。 | 否 | |
ssl |
類型:boolean |
true 如果已啟用 SSL。 |
true , false |
否 |
ssl_mode |
類型:enum【verify-ca 、verify-full 、 null】) |
Amazon Redshift 連線的安全性。 verify-ca (必須使用 SSL,且必須驗證伺服器憑證。) 和 verify-full (必須使用 SSL。 伺服器憑證必須經過驗證,且伺服器主機名稱必須符合憑證上的主機名稱屬性。) 受支援。如需詳細資訊,請參閱在 Amazon Redshift 文件中設定連線的安全選項。預設為 verify-ca 。 |
verify-ca , verify-full |
否 |
timeout |
類型:integer |
對伺服器的連線在逾時前要經過的秒數。 | 0 | 否 |
Athena 連線參數
Athena 的連線支援下列 Python AWS Glue 連線參數。
金錀 | Type | 描述 | 限制 | 必要 |
---|---|---|---|---|
aws_access_key_id |
類型:string - maxLength:256 |
指定與 IAM 帳戶相關聯的 AWS 存取金鑰。建議您將此資訊儲存在 中aws_secret 。 |
長度 16-128 | 否 |
aws_secret_access_key |
類型:string - maxLength:256 |
AWS 存取金鑰的私密部分。建議您將此資訊儲存在 中aws_secret 。 |
否 | |
aws_secret_arn |
類型:string |
用來擷取連線之其他參數的秘密 ARN。 | 有效的 ARN | 否 |
catalog_name |
類型:string - maxLength:256 |
目錄,其中包含使用驅動程式存取的資料庫和資料表。如需有關目錄的資訊,請參閱 DataCatalog。 | 否 | |
duration_seconds |
類型:number |
角色工作階段的持續時間 (以秒為單位)。此設定的值可介於 1 小時至 12 小時。根據預設,持續時間設定為 3600 秒 (1 小時)。 | 範圍從 900 秒 (15 分鐘) 到角色的工作階段持續時間上限設定 | 否 |
encryption_option |
類型:enum【SSE_S3 、SSE_KMS CSE_KMS 、 null】) |
Amazon S3 的靜態加密。請參閱 Athena 指南中的靜態加密一節。 | SSE_S3 , SSE_KMS , CSE_KMS |
否 |
kms_key |
類型:string - maxLength:256 |
AWS KMS 如果在 CSE_KMS 中使用 金鑰encrytion_option 。 |
否 | |
poll_interval |
類型:number |
在 Athena 中輪詢查詢結果狀態的間隔秒數。 | 否 | |
profile_name |
類型:string - maxLength:256 |
應使用其登入資料來驗證對 Athena 之請求的 AWS 組態設定檔名稱。 | 否 | |
region_name |
類型:string |
執行查詢 AWS 的區域。 | 有效 AWS 區域 | 否 |
result_reuse_enable |
類型:boolean |
啟用重複使用先前的查詢結果。 | true , false |
否 |
result_reuse_minutes |
類型:integer |
指定 Athena 應考慮重複使用的之前查詢結果的最長期限 (以分鐘為單位)。預設為 60。 | >= 1 | 否 |
role_arn |
類型:string |
用於執行查詢的角色。 | 有效的 ARN | 否 |
schema_name |
類型:string - maxLength:256 |
要用於資料庫的預設結構描述名稱。 | 否 | |
s3_staging_dir |
類型:string - maxLength:1024 |
Amazon S3 中存放查詢結果的位置。 | s3_staging_dir 或 work_group 為必要 |
|
work_group |
類型:string |
將在其中執行查詢的工作群組。如需有關工作群組的資訊,請參閱工作群組。 | ^【a-zA-Z0-9._-】{1,128}$ | s3_staging_dir 或 work_group 為必要 |
Snowflake 連線參數
Snowflake 的連線支援下列 Python AWS Glue 連線參數。
Snowflake 連線參數
金錀 | Type | 描述 | 限制 | 必要 |
---|---|---|---|---|
account |
類型:string - maxLength:256 |
Snowflake 帳戶識別符。帳戶識別符不包含snowflakecomputing.com 尾碼。 |
是 | |
arrow_number_to_decimal |
類型:boolean |
根據預設,False,這表示 NUMBER 資料欄值會傳回為雙精度浮點數 (float64 )。將此設定為 True,以在呼叫 fetch_pandas_all() 和 fetch_pandas_batches() 方法時傳回 DECIMAL 資料欄值作為小數位數 (decimal.Decimal )。 |
true , false |
否 |
autocommit |
類型:boolean |
預設為 false ,其會遵循 Snowflake 參數 AUTOCOMMIT 。將 設定為 true 或 ,false 分別在工作階段中啟用或停用 autocommit 模式。 |
true , false |
否 |
aws_secret_arn |
類型:string |
用來擷取連線之其他參數的秘密 ARN。 | 有效的 ARN | 否 |
client_prefetch_threads |
類型:integer |
用於下載結果集的執行緒數目 (預設為 4)。增加值可改善擷取效能,但需要更多記憶體。 | 否 | |
database |
類型:string - maxLength:256 |
要使用的預設資料庫名稱。 | 否 | |
login_timeout |
類型:integer |
登入請求的逾時,以秒為單位。預設為 60 秒。如果 HTTP 回應不是 ,則登入請求會在逾時長度之後放棄success 。 |
否 | |
network_timeout |
類型:integer |
所有其他操作的逾時,以秒為單位。預設為 none (無限)。如果 HTTP 回應不是 ,則一般請求會在逾時長度之後放棄success 。 |
否 | |
paramstyle |
類型:string - maxLength:256 |
從 Python 程式碼執行 SQL 查詢時,用於參數替換的預留位置語法。用戶端繫結pyformat 預設為 。指定 qmark 或 numeric 以變更伺服器端繫結的繫結變數格式。 |
否 | |
role |
類型:string - maxLength:256 |
要使用的預設角色名稱。 | 否 | |
schema |
類型:string - maxLength:256 |
要用於資料庫的預設結構描述名稱。 | 否 | |
timezone |
類型:string - maxLength:128 |
根據預設,無 會遵守 Snowflake 參數 TIMEZONE 。設定為有效的時區 (例如 America/Los_Angeles ) 以設定工作階段時區。 |
時區的格式類似於 America/Los_Angeles |
否 |
validate_default_parameters |
類型:boolean |
如果指定的資料庫、結構描述或倉儲不存在,請將 設定為 true 以引發例外狀況。預設為 false 。 |
否 | |
warehouse |
類型:string - maxLength:256 |
要使用的預設倉儲名稱。 | 否 |