本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
判斷遷移方法
若要決定遷移方法,您可以使用您在上一個階段對現有模式執行的分析。您組織的未來資料和分析需求也同樣重要。傳統的內部部署 ETL 工具可處理關聯式資料模型和結構化資料。如果您有半結構化和非結構化資料要處理,您可以使用 AWS AWS Glue 或 Amazon EMR 等服務進行遷移。可能影響遷移方法的其他因素包括:
-
您想要使用圖形界面 (例如 AWS Glue Studio) 或自訂架構 (例如 Spark/Python 程式庫)
-
您是否能夠安全存取內部部署來源和 AWS 目標
-
團隊所需的技能和訓練
-
稽核和合規要求
您可以從三種遷移方法中進行選擇:大型 Bang、分段和提升和轉移。下表比較這三種方法。
方法 | Description | 使用案例 | 優點和缺點 |
---|---|---|---|
大碰撞 | 在特定期間內遷移所有 SSIS 套件。 |
|
|
分段 | 為每個不同的模式和複雜性識別一個 SSIS 套件。將套件遷移至 AWS、測試和比較結果與現有架構。 |
|
|
提升和轉移 | 像往常一樣遷移目前的架構 AWS。 |
|
|
比較來源和目標系統上的資料對於成功遷移至關重要。由於現有生產系統從來源系統定期更新,因此此比較可能會變得令人困惑。因此,當您決定遷移方法時,我們建議您也決定資料驗證策略。
-
在特定日期和時間從來源系統的生產環境備份所有適用的資料庫和檔案。
-
在所有任務成功載入來自備份來源資料的資料後,從目標系統上的生產環境備份所有資料庫。
-
在測試環境中還原來源資料,並執行新的任務。
-
同意來源和目標 (舊和新) 資料庫之間的有效差異百分比。例如,您可以決定可接受低於 1% 的差異。
-
列出要涵蓋的所有驗證規則。
-
盡可能自動化比較,並涵蓋所有規則。