京公网安备 11010802034615号
经营许可证编号:京B2-20210330
过年回家妈妈教你什么是大数据分析_数据分析师培训
“大数据分析”这么高大上,妈妈怎么会懂呢?
不信?听听妈妈怎么说——会做饭就会大数据分析!
那么问题来了?做饭和大数据有什么关系呢?请听下面分析:
第一阶段:
菜地里的毛菜(原始系统的数据,有错误,不精准,毛菜有泥巴,有黄叶子),相当于ERP,PDM系统里面的原始数据。
第二阶段:
从菜地里采集到家,分门别类的堆在一起(初步去掉泥巴,黄叶子,分类堆放),相当于从原系统到ODS,ODS的意思是操作数据,即原始系统中的操作数据的一个副本,与原始数据是一模一样的,叫贴源,这个过程就叫数据采集、清洗、转换,即ETL干的事情,这个阶段叫初加工。
第三阶段:
把拿回家的各种菜洗净,去皮,按大小分类,去掉小的、烂的蔬菜,可以卖给超市了,对BI项目来说,就是从ODS到数据仓库的过程,数据的精加工过程,去伪存真,也要用到ETL来清洗转换,对缺项的数据补充完整,比如合并数据,合并字段,增加主数据描述字段,补充分类等。
第四阶段:
从菜农卖到超市,超市还要经过一次加工,比如包装成一小包一小包的,把蔬菜放在一起,水果放在一起,便于顾客直接购买,这一步就是从数据仓库到数集市的过程,数据集市就是包好、称好的净菜,价签已经打好的了,顾客直接付款可以拿走了,从数据仓库到数据集市就是形成一个一个的数据立方体,这个立方体的数据是加工好的,可以单独发布出去,离线使用,相当于一个execl数据文件,你可以用EXECL工具打开,也可以用WPS打开,打开以后,可以用表格表示,也可以用图表表示。
第五阶段:
妈妈配菜,妈妈根据家人一天要吃的菜肴规划,挑选各种各样的菜、肉组合在一起,有的直接可以食用,有的需要再加工,即烹调,然后端出来摆到餐桌上,家人只需要带一张嘴即可享用,对BI项目来说,就是报表的制作过程,业务分析人员,根据领导的要求,按照各个主题需求,从各个数据立方体中、或者一部分从数据仓库中取一些数据组合起来,并且定义展现方式,即把报表做好,发布出来,放到门户上,给与权限控制,哪些人可以享用这桌美味,这就是报表制作这个阶段干的事情,所以说,业务人员是否可以拖拽制作报表,关键看前面的数据立方体准备好没有,相当于是这样的,不是人人都是烹调高手,但是超市里面有很多配好的菜(葱姜蒜都有了),你只要拿回去放放锅里炒5分钟或者蒸煮10分钟,端出来即可,不难吧。至于加工的工具是微软家的锅还是IBM家的灶,或者oracle家的飘,有什么关系呢,这些都是报表制作工具(烹调工具而已)。
第六阶段
享受美味佳肴,把做好的一桌筵席,放到门户上,当然是给有权限的人享受,这就是管理驾驶舱噻。
通过上面的分析,懂的为什么会做饭的人就会做大数据分析了,简单吧,所以过年回家和妈妈学做饭,学会了就懂得高大上的大数据分析。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21