京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据分析:描述型、预测型和规定型
有什么可以区别这三种主要类型的分析呢?一位数据科学家解释了其中的差异。大部分原始数据,特别是大数据,不能在其未加工状态为我们提供很大的价值。当然,通过应用合适的工具,我们可以从这个存储的碎片中提炼出有力的见解。

任何大数据的设置,第一步是捕获大量的数字信息,“使其不存在短缺的问题”迈克尔·吴博士说。
有了第一手资料,就可以开始做分析了。但是,你该从哪里开始?哪一种分析类型更适合你的大数据环境呢?
吴在接受采访时解释了描述型的,预测型和规范型分析的不同,以及它们如何为组织提供价值。
他说。“一旦你有足够的数据,你就开始看到模式了,你就可以建立一个这些数据如何起作用的模型了。一旦你建立了一个模型,你就可以进行预测了。”
第一步:描述型分析
将描述型分析称为“最简单的一类分析,”利用这种分析你可以将大数据压缩成更小,更有益的信息。“记住,最原始的数据,尤其是大数据,不适合供人分析,但我们从数据中得出的信息是可以供我们分析的,
描述型分析的目的是总结发生了什么事。吴估计,超过80%的商务分析——最明显的是社会分析——是描述型的。
预测型分析是数据缩减的下一步
它利用各种统计,建模,数据挖掘技术和机器学习技术来研究近期的和历史的数据,从而使分析家对未来做出预测。
“预测型分析的目的不是为了告诉你将来会发生什么,”吴博客中写到。 “它不能做到这一点。事实上,任何分析都不能做到这一点。预测型分析只能预测在将来可能发生的事情,因为所有的预测型分析都是概率性的。”
吴告诉信息周刊说,在预测型分析的最一般的情况下,“基本上你需要得到你预测中没有的数据”
例如,情感分析是预测型分析的一种常见类型:
吴说:“纯文本的输入模型,以及这一模型的输出是一个情感指数,无论是积极的,消极的,或介于+1或-1之间的东西。”
在这种情况下,该模型计算出分数,但是它不一定能预测未来。相反,“它能预测我们没有的数据,即情绪标签数据,无论是正面或负面,”吴说。
规范型分析这一新兴技术通过建议一个或多个课程行动,以及显示每一决策的可能成果,超越了描述型和预测型模型
“规定型分析是预测型分析的一种,”吴说。“基本上是当我们需要规定一个动作,因此交易的决策者可以利用这一信息并采取行动。”
他补充说,预测型分析不能预测一个可能的未来,而是基于决策者行动的“多个未来”。
此外,规定型分析需要一个预测模型有两个额外的组件:可操作的数据和一个可以追踪所采取的行动所产生结果的反馈系统,。
“由于规定型模型能够预测基于不同行为选择可能带来的各种后果,它也可以为您推荐基于任何预先指定结果的最好的行动过程,”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10