京公网安备 11010802034615号
经营许可证编号:京B2-20210330
得大数据者得新工业革命先机
数据无限多时,就接近真实世界的本原。人类征服世界的前提是认识世界,既然借助大数据已经无限接近了真实世界,也就不必画蛇添足了,还是保持真实数据原貌最好,而且,认识世界的能力越强,人类征服世界和改造世界的能力也越强。
世界经济论坛第十届新领军者年会即夏季达沃斯论坛即将在天津举行,主题为“第四次工业革命——转型的力量”。届时,全球90多个国家和地区的超过1500位各界领军人物将集中探讨第四次工业革命对未来经济、社会、生态和文化的重要影响。今年1月下旬在瑞士小镇举行的达沃斯年会,主题也是“掌控第四次工业革命”,主要讨论第四次工业革命将如何改变人类生产、分配和消费模式,如何应对由此带来的挑战。世界顶级企业家与智库一年内两度探讨同一主题,在达沃斯论坛历史上还是首次。世界精英如此心仪新工业革命,盖因世界经济遇到了瓶颈,人们急切期望从新工业革命中找到突破口,找到人类可持续发展的钥匙。而要理解新工业革命,先得弄清大数据革命。
一般认为,大数据的数量级是在“太字节”即2的40次方以上,一般软件人员难以收集、存储、管理和分析的数据,而且这种认定还是相对的,随着科技进步,“大”的认定还会不断变化。但仅仅因为“大”而称之为大数据,风靡全球的大数据革命就没有太大意义了。在小数据时代,我们只能有选择性采集抽样数据、局部数据和片面数据,有时甚至在无法获得实证时纯粹靠经验、理论、假设和价值观去发现未知领域的规律。结果只能是对真实世界的抽象归纳与推理,这就不可避免包含了人的心理和主观因素。同时,由于样本的局部性,时间非全天候性,归纳推理中的主客观偏差,有时可能出现“蝴蝶效应”,差之毫厘,谬以千里。
大数据的真正意义在于:通过传感器,实现真实世界的全方位连接,得到全方位实时数据,交换、整合和云计算,逼近真实世界。
小数据追求“小”、“精”、“优”;大数据追求的是“多”、“杂”、“更优”。小数据时代,受科技水平的限制,只能依据随机样本,大数据则要求所有数据,在小数据时代只有5%的数据符合样本结构化要求,剩下的95%数据都被排斥在外了。大数据则良莠不拒,不求随机样本,而是全体数据;不求精确性,而是混杂性。小数据探求因果关系,即知道“为什么”,以便归纳推理和预测;而大数据只知道相关关系,不必知道因果关系,只要知道“是什么”不必知道“为什么”。小数据追求精确、完美,往往导致不精确、不完美;大数据不求精确、不求完美,反而导致了观测客观世界的更精确、更完美。如2009年谷歌通过大数据分析准确地得出什么地方发现了H1N1禽流感,而且判断非常及时,比美国疾控中心的判断结论要早一两周。美国安大略理工学院卡罗琳·麦格雷戈博士利用软件预测早产儿的病情,不仅比专业医生及时,而且一些病状,医生不能发现,而计算机能发现。这些人都没有医疗方面的专业背景。这样的例子在大数据时代还有很多。正如“大数据时代的预言家”,牛津大学教授维多克·迈尔-舍恩伯格所言:“在不久的将来,世界许多依靠人类判断力的领域都会被计算机系统所改变甚至取代。”这看似是一个矛盾的命题,其实是一个方法论上的革命,即“大数据革命”。
明代著名思想家洪应明说过:“文章极处无奇巧,人品极处只本然。”一个人写文章写到登峰造极的境界时,其实并没有什么写作艺术可言,只是把内心的真实感受真实地表现出来,让读者从内心产生共鸣。一个人的品德修养达到炉火纯青的境界时,就能“随心所欲不逾矩”,让人回归到纯真朴实的本然之性而已。大数据革命与此异曲同工:“工业革命无奇巧,数据大时只本然”。数据无限多时,就接近真实世界的本原。人类征服世界的前提是认识世界,既然借助大数据已经无限接近了真实世界,也就不必画蛇添足了,还是保持真实数据原貌最好,而且,认识世界的能力越强,人类征服世界和改造世界的能力也越强。
大数据“多”、“快”“好”“省”的优点奠定了新工业革命的基石。“数据多”,随着科技水平的进一步发展,大数据将无限逼近真实世界。“速度快”,全天候随时实现信息交换,没有时滞。“效果好”,大数据增加了人类的“观测”能力。美国麻省理工学院布伦乔尔森将大数据称之为人类社会行为观测的“显微镜”,就像望远镜让我们能洞察遥远的星河,显微镜让我们观察微小的细胞一样,大数据将帮助我们完成在通常的眼光下无法完成的工作。
新工业革命,本质上是智能革命,而智能革命的基础是信息化,大数据是根本。没有大数据对客观事物全面、快速、真实、准确的信息反馈,任何智能设备都不可能实现真正的智能。因此,西方学者将即将来临的新工业革命也称之“后信息时代的革命”,归根到底,这是“大数据的革命”。以至于知名信息专家涂子沛说:“数据可以治国,也可以强国”,“得数据者得天下”。借用涂子沛的这句话,我们还可以说:“数据可以治业,数据可以兴业,得大数据者将占据新工业革命之先机!”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15