京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“大数据”时代浓浓的统计学气息
统计学在近几年的变化,可以说受计算机的影响最为强烈。
计算机使商业模式发生了翻天覆地的变化。商品的采购、库存、销售等记录基本上全都已经数据化,成本和销量的把控与用纸笔进行管理的时代相比也变 得更加简单。顾客资料与消费记录、工作人员的工作时间与评定、健康状态、支付的报酬与成本核算等信息,都可以存储在公司内部系统和Excel电子表格中。 为了生产而进行的机械操作、到自己公司网站的链接,基本上所有的登录情况都会被记录下来,必要时可以综合统计作为经营的参考。就算说那些大型公司几乎所有 的业务流程已经全部实现电子化,也不为过。
但是,当一系列的业务都实现计算机化之后,那些从事计算机业务的企业却遭遇了瓶颈。不管他们如何提高硬件和软件的处理性能,如果需要计算机化的 业务流程没有增加,顾客对性能没有特别需求,那么他们就无法继续销售自己的商品。所以,不管是硬件厂商还是软件厂商,还是使用这些提供计算机服务的厂商, 所有与计算机相关的企业,都必须对已经得到满足的顾客们,提供一个购买他们更新技术的“理由”。
从好的方面来看,要想将已经足以满足顾客需要的性能更好地加以利用,就要考虑“如何创造更多的价值”。而实际上,计算机企业所考虑的是向顾客传 达“为了找出创造更多价值的方法,必须进行大量的数据处理”,为了让顾客接受这一提议,必须有一个“明显对商业有价值的理由”。
以现在的计算机技术来看,不管是多么庞大的数据量或者多么繁杂的计算都能够胜任,因此需要考虑的问题就变成了应该针对什么进行计算,而答案除了 统计分析之外再无其他。当然,如果只是将“统计分析”这个简单的词语作为题目,会让人感觉缺乏吸引力,于是就诞生出“大数据”和“商务智能”的概念。现在 大家之所以都对这两个题目和统计学如此关注,恐怕就是出于上述原因。
计算机行业的业界巨人,在弗明汉研究使用穿孔卡片和大型计算机时代就为其提供技术支持的IBM公司在这一点上表现得最为突出。IBM斥资数十亿 美元收购了在商务智能方面非常有名的Cognos公司,以及开发统计分析软件的SPSS公司,这两家公司都是在这一领域拥有丰富经验和影响力的公司。据说 2005~2011年之间,IBM公司对统计学和商务智能相关企业的投资金额已经超过140亿美元。
除了IBM之外,微软公司以及在数据库领域非常有名的甲骨文公司,还有NTT数据公司,都开始积极地收购与统计学和商务智能相关的企业。
或许这几家公司都已经发现,在接下来的时间里从自己的商业领域产生价值的主营产业,都在其中。
最能够证明这一推测的根据,来自于微软在专门用于招聘的网页上于2010年8月23日发表的一篇文章,其中提到技术领域今后最热门的3个专业,如下所示。
数据分析、机械学习、人工智能、自然语言处理。
商务智能、竞争分析。
分析、统计——特别是网页分析、分离测试(A/B测试)、统计分析。
只要是学过“计算机统计学”知识的人,都能够从上述内容里感觉到浓浓的统计学气息吧。
为了再现人类的认知机能,而从计算程序算法研究发展而来的机械学习与人工智能领域,如今若是没有统计学的理论基础就很难深入学习,至于商务智能 则完全可以说是统计学在商业领域的应用。要想完成A/B测试的计划,20世纪中叶现代统计学之父罗纳德·艾尔默·费希尔所完成的被称为“试验设计”的统计 学相关知识,则是最为重要的基础。
未来10年最受欢迎的职业是统计
另外,谷歌(Google)则比微软更加明确地表达了对统计学家的赞誉。谷歌的首席经济学家哈尔·范里安博士曾经在2009年1月麦肯锡公司发行的杂志上这样说道:
我一直坚信,未来10年最受欢迎的职业是统计。
最近,美国人经常使用“sexy”这个词来表达“受欢迎的”或者“有魅力的”,比如,“新款苹果手机的设计非常sexy”。哈尔认为统计学家也是“sexy”的。
作为一名统计学家,我对于哈尔的发言感到非常光荣,而且这绝对不是什么只停留在口头上的赞誉。统计学如今已经得到了计算机这个强有力的伙伴,可以被应用在所有领域,可以出现在世界上的每一个角落,以及人生中的每一个瞬间,能够对所有渴望得到回答的问题给出最佳答案。
曾经人类为了得到(自认为)正确的答案而只能寻求神的启示,后来在漫长时间中只能服从权威人士的意见。
但是,现在的情况不一样了。最佳答案就存在于每个人周围的数据之中。只要掌握统计学这个最强的学问,不管是想要健康、聪明,还是富裕,都变得非常简单。正如之前所说过的那样,这是世界上的学者们通过统计学证明的事实。
而想掌握这个最强、最受欢迎的学问,不必像IBM那样支付数额庞大的资金,只要在你的人生中投入一些学习时间就足够了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14