数据生命周期 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据生命周期

要构建数据管道,您必须先将来自外部或内部数据源(例如文件服务器、数据库、存储桶)或 API 调用的数据提取到 AWS。摄取的数据可能会经过也可能不会经过转换,例如匿名化、列删除或数据清理。

本节概述了数据生命周期过程中的各个阶段,如下图所示。

数据生命周期概述图

这些阶段包括以下内容:

  • 数据收集

  • 数据准备和清理

  • 数据质量检查

  • 数据可视化和分析

  • 监控和调试

  • IaC 部署

  • 自动化和访问控制