京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据产业积极落地 会是未来“数据主义”前奏吗
翻看科技发展史,当某些跨时代的技术转捩点来临之时,两种状况似乎同时出现:大众观念里的鸡同鸭讲,以及,从业者对于概念追逐的狂热。近几年一个好例子即是:大数据。
公众一端:哪怕到了2015年,当马云数次宣称阿里正从一家IT企业转型为DT企业,舆论普遍关切的依旧是最新出炉的商业鸡汤。 从农业社会,工业社会,到信息社会,中国两三步并作一步的路径,让数据概念几乎远离大众语境。
产业一端:大概三年多前,创业公司十之八九说自己能做大数据,与之相关的产业链也被粗暴切分为采集,处理,分析,可视化四个节点,一时间暗潮汹涌——泡沫也随之而来,从2014年进入2015年,行业开始小步洗牌,大数据从一个纯技术名词,或者说一个虚妄的概念,转变为应用范畴,以更为务实的姿态蔓延到一个又一个行当。时至今日,对大数据概念的热炒已有些无力,各种峰会与论坛所谈话题几乎都是如何让大数据“落地”的声音更为掷地有声。
大数据产业积极落地 会是未来“数据主义”前奏吗?
当然,让数据落地并非新鲜论调,真正令人着迷的是落地的“程度”——数据即权力,这是我真正想说的,大数据带来了权威的转移。
早在几年前关于大数据的哲学意涵呼之欲出的时候,数据是一种“宗教”就被不少学者大肆探讨。最近,我看到关于数据未来最具象的描述,来自《人类简史》作者尤瓦尔·赫拉利(我觉得他最有希望代替凯文·凯利在中国互联网界的地位),他为我们勾勒了一个“数据主义”的未来时代。
在他看来,那些极端的持数据主义世界观的“信徒”将整个世界视作一个数据流,任何事物的价值判断都由它对数据处理的贡献决定。“正如自由市场资本主义者相信市场无形的手,数据主义者相信数据流无形的手,当全球数据处理体系变得全知全能,接入这个系统就成为了一切意义的来源。”
从几年前从业者对大数据概念的热炒便知,大数据是个无远弗届的概念。赫拉利就曾写道:“数据主义允诺了人类在过去几个世纪里求而不得的科学‘圣杯’:一项将从音乐学,经济学一直到生物学的科学学科统一起来的无所不包的理论。根据数据主义,贝多芬第五交响曲,股票交易泡沫和流感病毒不过是三种数据流形式,能用相同基本概念和工具进行分析。”
嗯,数据主义的未来对数据从业者而言非常诱人——倘若数据是这个世界的主体,侍奉它的人无疑将收益颇丰。
将视角拉至现实。
搁置在上述宏大叙事框架中,如果你忘了未来由现实铺就,以下数字似乎顿时显得渺小。
我看到的数字,2016年上半年,共有18家大数据相关创业公司获得上千万融资;新三板与大数据相关企业有50家左右。在寒冬中,资本市场对大数据项目怀有巨大热情。其中一个原因是,越来越多投资者厌倦甚至惶恐于B2C疯狂烧钱的迷途,开始转向那些由技术驱动,商业模式清晰健康的领域,大数据就非常符合他们的胃口,何况在包括赫拉利在内的一众预言家眼中,它看起来就是未来本身。
现在看来,无论数据采集,传输,建模存储,统计分析挖掘还是可视化,都存在创业者的短兵相接。但从他们的服务对象一端分析,必须承认,诸多企业在试图驾驭数据的过程中,都面临着如何快速有效地处理海量数据,以及密集的多源异构数据的现实境遇,对数据关键节点有效整合的方案缺失,也让决策者丧失了对自身业务的最终判断。
而站在数据运营商的立场,将项目充分产品化,脱离难以复制且交付难度相对较大的项目制,无疑是将生命周期延绵下去的最佳商业模式——在大数据行业,这并非易事,困扰大数据产品化至少有三个痛点:1,数据量太大,这对软硬件系统都会带来巨大冲击;2,作为决策依据,数据处理的效率必须非常之高。3,多样性,行业和业务场景的不同,会对数据的呈现方式有不同要求。
所以买卖双方因素相加,做数据的生意,理想之举无疑是提供一整套完善的解决方案——用户的需求加快了大数据行业从软件到硬件到一站式应用的产品化进程。毕竟,面对行业的多元化需求,人们对过去单一的数据分析产品似乎愈加不满,在理解数据的方式上,他们希望最好能有从数据发现,存储,到可视分析,再到交互模式的一站式产品。举例来说,最近被投资人颇为看好的海云数据就发布了通用性综合解决方案“图易大数据决策产品生态平台”,提供一站式整体解决方案,协助企业,园区,城市,政府,重新通过数据认知自己的业务。举这个例子是因为,在面对任何项目和节点里,他们80%的工作都已经完全实现标准化和模块化,另20%则可根据不同行业属性和应用节点定制。
总之,说到底,这个时代,驾驭数据的能力是所有决策者“技能清单”里最重要的一章,因为任何行业,无论竞争,合作,还是管理,其本质都将趋向于“信息战”。而技术变迁史又同时告诉我们,无论哪个行业,谁能率先在行业中拾起新工具是多么重要。譬如对于数据的掌握,谁都知道数据可视分析能最大化做到价值变现,但当不少决策者还将思维停留在用饼状图和百分比了解业务,或者用守旧的IT系统装备自己时,他们已经落伍了,而那些对诸如图易这种“正在发生”的新工具敏感的决策者,无疑拥有了赢得信息战的利器。
因为,历史早已证明,当一项跨时代的技术转捩点来临之时,除了开篇所言的“大众观念里的鸡同鸭讲”以及“从业者对于概念追逐的狂热”,还有另一件更重要的事同时发生:新技术的诞生本身即是一个人群分野过程,它将人群划分为“会用它的”和“不会用它的”——率先拿起新工具的人总会走在竞争者前面。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22