判斷遷移方法 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

判斷遷移方法

若要決定遷移方法,您可以使用您在上一個階段對現有模式執行的分析。您組織的未來資料和分析需求也同樣重要。傳統的內部部署 ETL 工具可處理關聯式資料模型和結構化資料。如果您有半結構化和非結構化資料要處理,您可以使用 AWS AWS Glue 或 Amazon EMR 等服務進行遷移。可能影響遷移方法的其他因素包括:

  • 您想要使用圖形界面 (例如 AWS Glue Studio) 或自訂架構 (例如 Spark/Python 程式庫)

  • 您是否能夠安全存取內部部署來源和 AWS 目標

  • 團隊所需的技能和訓練

  • 稽核和合規要求

您可以從三種遷移方法中進行選擇:大型 Bang、分段和提升和轉移。下表比較這三種方法。

方法 Description 使用案例 優點和缺點
大碰撞 在特定期間內遷移所有 SSIS 套件。
  • 複雜性、範圍和目標架構很清楚。

  • 團隊具備必要的技能,或學習曲線較淺。

  • 高風險。

  • 比分階段方法花費更少的時間。

  • 您可以使用 AWS Glue、Amazon EMR 或自訂架構。

分段 為每個不同的模式和複雜性識別一個 SSIS 套件。將套件遷移至 AWS、測試和比較結果與現有架構。
  • 時間不是限制條件。

  • 您希望針對不同的 ETL 模式進行不同的設計。

  • 比大型巨型方法風險更低,但需要更多時間和精力。

  • 您可以使用 AWS Glue、Amazon EMR 或自訂架構。

提升和轉移 像往常一樣遷移目前的架構 AWS。
  • 不再支援您的內部部署硬體。

  • 您沒有資源可立即規劃遷移。

  • 最少的遷移工作量和所需的時間。

  • 現有解決方案的問題會保持開啟 AWS。

  • SSIS 套件會照原樣執行。不需要其他 ETL 工具或架構。

比較來源和目標系統上的資料對於成功遷移至關重要。由於現有生產系統從來源系統定期更新,因此此比較可能會變得令人困惑。因此,當您決定遷移方法時,我們建議您也決定資料驗證策略。

  • 在特定日期和時間從來源系統的生產環境備份所有適用的資料庫和檔案。

  • 在所有任務成功載入來自備份來源資料的資料後,從目標系統上的生產環境備份所有資料庫。

  • 在測試環境中還原來源資料,並執行新的任務。

  • 同意來源和目標 (舊和新) 資料庫之間的有效差異百分比。例如,您可以決定可接受低於 1% 的差異。

  • 列出要涵蓋的所有驗證規則。

  • 盡可能自動化比較,並涵蓋所有規則。