京公网安备 11010802034615号
经营许可证编号:京B2-20210330
非互联网从业者:大数据给我工作与思维带来的变革
第一次听到Big Data/大数据还是在欧洲念商学院的时候,有一门课叫做《管理咨询》。教授看了2012年10月的《哈佛商业评论》,兴致勃勃的对我们说,小组期末作业(当时我们的是一个市场预测项目)所有的分析都必须基于更多的数据。用他的话说:“只有你无情的虐数据,它才会乖乖的告诉你,你想了解的信息”。同时他也提到,利用部分信息的不可获得性来进行信息倒卖的生意,在以后会越来难做。
这些天读了维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger)的《大数据时代》有一些感触。我现在的工作虽然不在咨询公司,但也涉及对企业行业的判断与预期,因此从管理/商业的角度来说说这一趋势对我的工作与思维带来的影响:
1、数据的意义:
举最贴近我的例子,我研究生是学“项目管理”的,这门学科中有一个技术或者说方法叫做 Earned Value(EV)/挣值,通过项目经理制定收集和发亏信息的范围、方式和频率,由项目中具体操作人员进行数据采集、粗加工和反馈。基于这些被初步加工过的数据,项目经理可以了解到诸如项目是否超支、是否延期等信息。除了与利益相关人交流外,这些信息本身是没有作用的,它们的作用于价值是体现在“应该触发/不触发相应的行动进行干预和调整”上,也就是用这些数据进行预测从而实现干预以获得理想的结果。
从企业管理的角度看,虽然不同的利益相关人(比如股东、管理者、监管部门、公司员工)对企业有不同的期待与要求,审计对他们的作用是相似的:财务数据是否真实可靠?能否利用这些数据进行决策? 市场数据、人力数据、科研数据等也是类似——我们关注数据的真实性最终还是希望能用这些数据进行预测与决策,而不是数据本身。
我们关注企业领导者对其企业战略、组织架构和流程的描述最终是需要相应的数据进行支持,从而判断这个企业能否构筑一条“路”通向其所期待的终点。因此战略决策、投资决策和管理改进的决策都将基于这些预测。
2、我们对数据的态度:
作为一个非财务学生/工作者,在我接触这类学科时,了解到会计/财务使用的数据应满足:相关性、可靠性、可比性和可理解性。考虑到财务数据的特殊性,其他数据还应考虑透明性(并非所有数据都是一手的)和准确性(并非所有数据都有明确的获取和储存标准与流程)。
用作者的话说,对数据的衡量标准为:正确性、准确性、严格度和纯洁性。
在目前的趋势下,数据透明性有较大的提高(由于互联网的作用,很多信息变得可以获得了)那么我们对数据其他方面的容忍度也会下降或者说也不得不下降。这体现在我们被暴露在更多的数据下,会发现很多以前所没有关注和思考过的问题,而处理和解决这些问题方法也许也是我们之前所没有的。比如我们为了在A和B两个方面进行论证而收集数据,而为了A方面而收集的数据又揭示了B方面可能存在的问题。这部分数据相对B方面而言是不准确或者说不严格的(从数据来源与采集方式等角度来看),但其意义又是不容忽视的。
因此创新精神(如何发现新问题、展开新思考和采用新办法)以及相应的知识管理(如果再次遇到,我们应当如何处理),又显得尤为重要了。这也是我对舍恩伯格提到的三个趋势的理解:
3、在这一趋势下,我们能做什么?
回国后参加过一家在地产咨询界赫赫有名的咨询公司的面试,最后决定我放弃这个offer的原因只是那个经理人的一句话。当时我问他,他们公司拥有怎样的数据库,他们在项目中会用怎样的方法对数据本身进行加工。他给到我的回答是:在大环境下,很多信息是非公开的,因此不需要拥有很多的信息或对信息进行加工,它们本身就是可以卖钱的。而我的理解是作者认为大数据价值链将有三类角色,即掌握海量数据的公司、提供数据分析能力的技术公司以及提供思维的公司和个人。目前看来应该是掌握数据的公司,因为现阶段很多数据还是不可得的或者不能有效收集的,因此这类公司可以授权相关的公司来分析数据。而技术分析公司虽有可转移的的技术,可却很难再进行海量数据的收集。
而从我的角度来看,最重要的是第三类公司,因为前两者只是资源的储备者,而第三类公司才是资源与价值的转化者。在信息透明度仍在提高的进程中,我们更加关注的应当是如何利用好已有数据进行认知、预测、判断与决策。
引用作者的话,“正在发生的未来”,“更好地方法和答案还在不久的将来”。以上是我一些粗浅的见解。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19