將現場部署 ThoughtSpot 獵鷹資料庫遷移到 Amazon Redshift - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將現場部署 ThoughtSpot 獵鷹資料庫遷移到 Amazon Redshift

創建者:巴圖爾加·普雷瓦拉查 (AWS) 和安東尼·普拉薩德·泰瓦拉治 (AWS)

環境:PoC 或試點

來源:本地 ThoughtSpot 獵鷹數據庫

目標:Amazon Redshift

R 型:重新建築

工作負載:所有其他工作

技術:移轉;資料庫

AWS 服務:AWS DMS;Amazon Redshift

Summary

內部部署資料倉儲需要大量的管理時間和資源,尤其是大型資料集。建造,維護和增長這些倉庫的財務成本也非常高。為了協助管理成本、降低擷取、轉換和載入 (ETL) 複雜性,並在資料成長時提供效能,您必須不斷選擇要載入的資料以及要封存的資料。

透過將現場部署 ThoughtSpot Falcon 資料庫遷移到 Amazon Web Services (AWS) 雲端,您可以存取雲端資料湖和資料倉儲,從而提高業務靈活性、安全性和應用程式可靠性,同時降低整體基礎設施成本。Amazon Redshift 有助於大幅降低資料倉儲的成本和營運開銷。您也可以使用 Amazon Redshift Spectrum 以原生格式分析大量資料,而無需載入資料。

此模式描述了將 ThoughtSpot Falcon 資料庫從現場部署資料中心遷移到 AWS 雲端上的 Amazon Redshift 資料庫的步驟和程序。

先決條件和限制

先決條件

  • 有效的 AWS 帳戶

  • 在內部部署資料中心託管的 ThoughtSpot Falcon 資料庫

產品版本

  • ThoughtSpot 7.0.1 版本 

架構

將 ThoughtSpot Falcon 資料庫從現場部署資料中心遷移到 Amazon Redshift。

該圖顯示以下工作流程:

  1. 資料託管在內部部署關聯式資料庫中。

  2. AWS Schema Conversion Tool (AWS SCT) 會轉換與 Amazon Redshift 相容的資料定義語言 (DDL)。

  3. 建立表格之後,您可以使用 AWS Database Migration Service (AWS DMS) 遷移資料。

  4. 該數據被加載到 Amazon Redshift。

  5. 如果您使用 Redshift 頻譜或已經在 Amazon S3 中託管資料,則資料會存放在亞馬遜簡單儲存服務 (Amazon S3) 中。

工具

  • AWS DMS — AWS 資料遷移服務 (AWS DMS) 可協助您快速安全地將資料庫遷移到 AWS。

  • Amazon Redshift — Amazon Redshift 是一種快速、全受管的 PB 級資料倉儲服務,可讓您使用現有的商業智慧工具,以簡單且經濟實惠的方式,有效率地分析所有資料。

  • AWS SCT — AWS Schema Conversion Tool (AWS SCT) 可將現有的資料庫結構描述從一個資料庫引擎轉換為另一個資料庫引擎。

史诗

任務描述所需技能

識別適當的 Amazon Redshift 組態。

根據您的需求和資料量,識別適當的 Amazon Redshift 叢集組態。 

如需詳細資訊,請參閱 Amazon Redshift 文件中的 Amazon Redshift 叢集

DBA

研究 Amazon Redshift 以評估它是否符合您的要求。

使用 Amazon Redshift 常見問答集來了解和評估 Amazon Redshift 是否符合您的需求。

DBA
任務描述所需技能

創建一個 Amazon Redshift 集群。

登入 AWS 管理主控台,開啟 Amazon Redshift 主控台,然後在虛擬私有雲端 (VPC) 中建立 Amazon Redshift 叢集。 

如需詳細資訊,請參閱 Amazon Redshift 文件中的在 VPC 中建立叢集

DBA

為您的 Amazon Redshift 資料庫設計執行 PoC。

透過為資料庫設計執行概念驗證 (PoC),以遵循 Amazon Redshift 最佳實務。 

如需詳細資訊,請參閱亞馬遜紅移文件中的對亞馬 Amazon Redshift 進行概念驗證

DBA

建立資料庫使用者。

在 Amazon Redshift 資料庫中建立使用者,並授與適當的角色以存取結構描述和表格。 

如需詳細資訊,請參閱 Amazon Redshift 文件中的授予使用者或使用者群組的存取權限。

DBA

將組態設定套用至目標資料庫。

根據您的需求,將組態設定套用至 Amazon Redshift 資料庫。 

如需有關啟用資料庫、工作階段和伺服器層級參數的詳細資訊,請參閱 Amazon Redshift 文件中的組態參考

DBA
任務描述所需技能

在 Amazon Redshift 中使用 DDL 手動創建表。

(選擇性) 如果您使用 AWS SCT,則會自動建立資料表。不過,如果複寫 DDL 時發生失敗,您必須手動建立資料表

DBA

建立 Redshift 頻譜的外部表格。

使用 Amazon Redshift Spectrum 的外部結構描述建立外部資料表。若要建立外部表格,您必須是外部結構描述的擁有者或資料庫超級使用者。 

如需詳細資訊,請參閱亞馬遜紅移文件中的為 Amazon Redshift Spectrum 建立外部表格

DBA
任務描述所需技能

使用 AWS DMS 來遷移資料。

在 Amazon Redshift 資料庫中建立表格的 DDL 之後,請使用 AWS DMS 將資料遷移到 Amazon Redshift 移。

如需詳細步驟和指示,請參閱 AWS DMS 文件中的使用 Amazon Redshift 資料庫做為 AWS DMS 的目標

DBA

使用 COPY 指令載入資料。

使用 Amazon Redshift COPY 命令將數據從 Amazon S3 加載到 Amazon Redshift。

如需詳細資訊,請參閱亞馬遜紅移文件中的使用 COPY 命令從 Amazon S3 載入

DBA
任務描述所需技能

驗證來源和目標記錄。

驗證從來源系統載入的來源和目標記錄的表格計數。

DBA

實作 Amazon Redshift 最佳實務以進行效能調整。

實作表格和資料庫設計的 Amazon Redshift 最佳實務。 

如需詳細資訊,請參閱部落格文章 Amazon Redshift 的十大效能調整技術

DBA

最佳化查詢效能。

Amazon Redshift 使用 SQL 查詢與系統中的資料和物件互動。資料操作語言 (DML) 是 SQL 的子集,您可以用來檢視、新增、變更和刪除資料。DDL 是用來新增、變更及刪除資料庫物件 (例如資料表和檢視) 的 SQL 子集。

如需詳細資訊,請參閱 Amazon Redshift 文件中的調整查詢效能

DBA

實作 WLM。

您可以使用工作負載管理 (WLM) 定義多個查詢佇列,並在執行時期將查詢路由至適當的佇列。

如需詳細資訊,請參閱 Amazon Redshift 文件中的實作工作負載管理

DBA

使用並行縮放。

透過使用並行擴展功能,您可以支援幾乎無限制的並行使用者和並行查詢,並具有一致的快速查詢效能。

如需詳細資訊,請參閱 Amazon Redshift 文件中的使用並行擴展

DBA

使用 Amazon Redshift 最佳實務進行表格設計。

規劃資料庫時,某些重要的資料表設計決策可能會對整體查詢效能產生極大的影響。

如需有關選擇最合適資料表設計選項的詳細資訊,請參閱 Amazon Redshift 說明文件中的 Amazon Redshift 設計資料表的最佳實務

DBA

在 Amazon Redshift 中創建具體化視圖。

具體化視觀表包含根據一或多個基礎表格上 SQL 查詢的預先計算結果集。您可以使用與查詢資料庫中其他表格或視觀表相同的方式,發出SELECT敘述句來查詢具體化視觀表。

如需詳細資訊,請參閱 Amazon Redshift 文件中的在 Amazon Redshift 中建立具體化視圖

DBA

定義表之間的連接。

若要在中同時搜尋一個以上的資料表 ThoughtSpot,您必須指定包含跨兩個資料表相符資料的欄,以定義資料表之間的聯結。這些欄代表聯結foreign keyprimary key和。

您可以通過使用 Amazon Redshift 或ALTER TABLE ThoughtSpot命令來定義它們。如需詳細資訊,請參閱 Amazon Redshift 文件中的 ALTER 表

DBA
任務描述所需技能

添加一個 Amazon Redshift 連接。

將 Amazon Redshift 連接添加到您的現場部署 ThoughtSpot Falcon 數據庫。

如需詳細資訊,請參閱 ThoughtSpot 文件中的新增 Amazon Redshift 連線

DBA

編輯 Amazon Redshift 連接。

您可以編輯 Amazon Redshift 連接以添加表格和列。

如需詳細資訊,請參閱 ThoughtSpot 文件中的編輯 Amazon Redshift 連線

DBA

重新映射 Amazon Redshift 連接。

編輯新增 Amazon Redshift 連線時建立的來源對應 .yaml 檔案,以修改連線參數。 

例如,您可以將現有的資料表或資料行重新對應至現有資料庫連線中的其他資料表或資料行。 ThoughtSpot 建議您在重新對映連線中的表格或欄之前和之後檢查相依性,以確保它們依需要顯示。

如需詳細資訊,請參閱文件中的重新對應 Amazon Redshift 連線。 ThoughtSpot

DBA

從 Amazon Redshift 連接中刪除一個表。

(選擇性) 如果您嘗試移除 Amazon Redshift 連線中的表格,請 ThoughtSpot 檢查相依性並顯示相依物件的清單。您可以選擇列出的物件來刪除它們或移除相依性。然後,您可以移除表格。

如需詳細資訊,請參閱 ThoughtSpot 文件中的從 Amazon Redshift 連線刪除表格

DBA

從 Amazon Redshift 連線中刪除含有相依物件的表格。

(選擇性) 如果您嘗試刪除具有相依物件的資料表,則會封鎖該作業。會出現一個Cannot delete視窗,其中包含相依物件的連結清單。刪除所有依賴關係後,您可以刪除該表

如需詳細資訊,請參閱 ThoughtSpot 文件中的從 Amazon Redshift 連線刪除包含相依物件的表格。

DBA

刪除亞 Amazon Redshift 連接。

(選擇性) 由於連線可用於多個資料來源或視覺效果,因此您必須先刪除使用該連線的所有來源和任務,才能刪除 Amazon Redshift 連線。

如需詳細資訊,請參閱 ThoughtSpot 文件中的刪除 Amazon Redshift 連線

DBA

檢查 Amazon Redshift 的連接參考。

請確定您使用 ThoughtSpot 文件中的連線參考提供 Amazon Redshift 連線的必要資訊。

DBA

其他資訊