2021-03-11
阅读量:
474
如何整理不同来源的数据?
问:
如何整理不同来源的数据?
答:
数据仓库中的数据通常从多个数据源中提取,整合、汇总后成为数据仓库中的历史记录。多个数据源
(内部业务数据库、外部文件、爬虫、第三方API等等)的数据存储方式不同,所以需要经过抽取、清
洗、转换。
数据从数据库到数据仓库的处理过程就是ETL(Extract-Transform-Load):
1.Extract:数据抽取,就是把数据从多个数据源读出来
2.Transform:数据转换,就是把数据转换为统一的格式
3.Load:数据加载,把处理后的数据加载到数据仓库






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论