Amazon Redshift 佈建叢集概觀 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Redshift 佈建叢集概觀

Amazon Redshift 服務會管理設定、操作和擴展資料倉儲的所有工作。這些工作包括佈建容量、監控和備份叢集,以及對 Amazon Redshift 引擎套用修補程式和升級。

以下影片說明如何使用 Amazon Redshift 查詢編輯器 v2 建立叢集和查詢資料。

叢集管理

Amazon Redshift 叢集是一組節點,其中包含一個領導者節點和一或多個運算節點。您需要的運算節點的類型和數量取決於您的資料的大小、將執行的查詢數量,以及您需要的查詢執行時間效能。

建立和管理叢集

取決於您的資料資料倉儲需求,您可以從小型的單一節點叢集開始,並隨著您的需求變更,輕鬆向上擴展至更大型的多節點叢集。您可以對叢集新增或移除運算節點而不會中斷服務。如需詳細資訊,請參閱 Amazon Redshift 佈建叢集

預留運算節點

如果想要讓叢集執行一年以上,可以透過預留一年或三年期間的運算節點來節省金錢。相較於隨需佈建運算節點時的每小時費率,預留運算節點可大幅節省成本。如需詳細資訊,請參閱 購買 Amazon Redshift 預留節點

建立叢集快照

快照是叢集的 point-in-time 備份。有兩種類型的快照:自動和手動。Amazon Redshift 會透過使用加密的 Secure Sockets Layer (SSL) 連線,將這些快照儲存在 Amazon Simple Storage Service (Amazon S3) 內部。如果您必須從快照還原,Amazon Redshift 會建立新的叢集並從您指定的快照匯入資料。如需快照的相關資訊,請參閱 Amazon Redshift 快照和備份

叢集存取和安全

有數個功能與 Amazon Redshift 中的叢集存取和安全性相關。這些功能有助於控制對您的叢集的存取、定義連線規則,以及加密資料與連線。這些是 Amazon Redshift 中的資料庫存取和安全性相關功能以外的功能。如需資料庫安全的相關資訊,請參閱《Amazon Redshift 資料庫開發人員指南》中的管理資料庫安全

AWS 帳戶和 IAM 登入資料

根據預設,只有建立叢集的 AWS 帳戶才能存取 Amazon Redshift 叢集。叢集會遭鎖定以防止他人存取。在您的 AWS 帳戶中,您可以使用 AWS Identity and Access Management (IAM) 服務建立使用者帳戶並管理這些帳戶的許可,以控制叢集作業。如需詳細資訊,請參閱 Amazon Redshift 中的安全。如需如何管理 IAM 身分的相關資訊 (包括 IAM 角色的指引和最佳實務),請參閱 Amazon Redshift 中的身分和存取管理

安全群組

根據預設,您建立的叢集會對所有人關閉。IAM 憑證只能控制對 Amazon Redshift API 相關資源的存取:Amazon Redshift 主控台、命令列介面 (CLI)、API 和 SDK。若要啟用透過 JDBC 或 ODBC 從 SQL 用戶端工具對叢集的存取,您可以使用安全群組:

  • 如果對您的 Amazon Redshift 叢集使用 EC2-VPC 平台,您必須使用 VPC 安全群組。建議您在 EC2-VPC 平台中啟動叢集。

    叢集若已搭配 EC2-Classic 完成啟動,則您無法將該叢集移動至 VPC。不過,您可以使用 Amazon Redshift 主控台將 EC2-Classic 快照還原至 EC2-VPC 叢集。如需詳細資訊,請參閱 從快照還原叢集

  • 如果您對您的 Amazon Redshift 叢集使用 EC2-Classic 平台,則必須使用 Amazon Redshift 安全群組。

在任一情況下,如果您的 SQL 用戶端在 Amazon Elastic Compute Cloud (Amazon EC2) 執行個體上執行,則可以新增規則至安全群組,以授予明確的輸入存取給特定範圍的 CIDR/IP 地址或 Amazon EC2 安全群組。如需詳細資訊,請參閱 Amazon Redshift 叢集安全群組

除了輸入存取規則,您可以建立資料庫使用者來提供登入資料,向叢集本身的資料庫進行驗證。如需詳細資訊,請參閱此主題中的資料庫

加密

佈建叢集時,您可以選擇性地加密叢集來獲得額外的安全性。啟用加密時,Amazon Redshift 會將所有資料以加密格式儲存在使用者建立的資料表中。您可以使用 AWS Key Management Service (AWS KMS) 來管理您的 Amazon Redshift 加密金鑰。

加密是叢集不可變的屬性。從加密叢集切換至未加密叢集的唯一方式,是卸載資料,再將資料重新載入至新的叢集。加密會套用至叢集和任何備份。從加密的快照還原叢集時,新的叢集也會加密。

如需加密、金鑰和硬體安全性模組的相關資訊,請參閱Amazon Redshift 資料庫加密

SSL 連線

您可以使用 Secure Sockets Layer (SSL) 加密來加密您的 SQL 用戶端和您的叢集之間的連線。如需詳細資訊,請參閱 設定連線的安全選項

監控叢集

有數個功能與 Amazon Redshift 中的監控相關。您可使用資料庫稽核記錄產生活動紀錄、設定事件和通知訂閱,以追蹤感興趣的資訊。使用 Amazon Redshift 和 Amazon 中的指標 CloudWatch 來了解叢集和資料庫的運作狀態和效能。

資料庫稽核記錄日誌

您可以使用資料庫稽核記錄功能來追蹤身分驗證嘗試、連線、中斷連線、對資料庫使用者定義的變更,以及資料庫中所執行查詢的相關資訊。此資訊對於 Amazon Redshift 中的安全性和故障診斷目的很有幫助。日誌會儲存在 Amazon S3 儲存貯體中。如需詳細資訊,請參閱 資料庫稽核記錄日誌

事件和通知

Amazon Redshift 會追蹤事件,並在您的 AWS 帳戶中保留數週的相關資訊。對於每個事件,Amazon Redshift 會報告相關的資訊,如事件發生的日期、描述、事件來源 (例如,叢集、參數群組或快照),以及來源 ID。您可以建立指定一組事件篩選條件的 Amazon Redshift 事件通知訂閱。發生符合篩選條件的事件時,Amazon Redshift 便會使用 Amazon Simple Notification Service 來主動通知您已發生事件。如需事件和通知的相關資訊,請參閱Amazon Redshift 事件

效能

Amazon Redshift 提供您可以追蹤叢集和資料庫之運作狀態和效能的效能指標和資料。Amazon Redshift 使用 Amazon CloudWatch 指標來監控叢集的實體層面,例如 CPU 使用率、延遲和輸送量。Amazon Redshift 也會提供查詢和載入的效能資料,以協助您監控叢集中的資料庫活動。如需效能指標和監控的相關資訊,請參閱監控 Amazon Redshift 叢集效能

資料庫

Amazon Redshift 會在您佈建叢集時建立一個資料庫。這是您用來載入資料並對資料執行查詢的資料庫。您可以視需要執行 SQL 命令來建立額外的資料庫。如需建立額外資料庫的相關資訊,請參閱《Amazon Redshift 資料庫開發人員指南》中的步驟 1:建立資料庫

佈建叢集時,您會指定管理員使用者,其會具有叢集內所建立一切資料庫的存取權。這個管理員使用者是超級使用者,他是最初可存取資料庫的唯一使用者,不過這個使用者可以建立其他的超級使用者和使用者。如需詳細資訊,請前往《Amazon Redshift 資料庫開發人員指南》中的超級使用者使用者

Amazon Redshift 使用參數群組來定義叢集中所有資料庫的行為,例如日期呈現樣式和浮點精確度。如果佈建叢集時不指定參數群組,Amazon Redshift 會將叢集與預設的參數群組建立關聯。如需詳細資訊,請參閱 Amazon Redshift 參數群組

如需 Amazon Redshift 中資料庫的相關資訊,請前往《Amazon Redshift 資料庫開發人員指南》https://docs.aws.amazon.com/redshift/latest/dg/