
对于大数据存在多少偏见乃至误读呢
近几年,得益于资本追捧、企业造势、媒体推广以及公众往往跟风式参与,一些新概念或被引进、或被改造、或被提炼,其中代表性的有:大数据、互联网思维、“互联网+”、云计算、智慧城市、媒体融合、人工智能、IP、VR/AR等。其传播套路(流行持久度)大致为:今天你爆红,明日我当道,各领风骚真热闹。只是,在一阵阵浮躁、喧嚣与狂热的背后,这些新概念究竟有多少真正被正确理解了,而又有多少存在偏见乃至误读呢?
特别值得说说的,首推大数据。
对这个舶来的、随着2012年在有着“大数据商业应用第一人”之称的维克托·舍恩伯格那本全球级畅销书《大数据时代》隆重登场的新概念,先是在国内的互联网业界刮起一阵超级旋风,继而风靡了整个社会,由科技界的热门词变身为社会高频词,人人争说大数据,唯恐掉队落伍。说得更尖锐些,和绝大多数“新概念”一样,“大数据”已经成了许多闭门造车者竭尽全力宣扬的主题。这种现象与2005年盛极一时的Web2.0革命论如出一辙。那么,结果如何呢?在“中国互联网老兵”谢文看来,“一个概念,无论它可以抽象到多么高深的程度,其形成、演变、推广的过程往往却很实在、具体,充斥着不同社会力量的博弈。这个概念的对错与否、生命力的长短、对社会的影响往往不取决于概念本身,而在于它的社会价值”。因此他得出结论,“关于大数据,你知道的都不对!”
《大数据经济》是谢文的第二本书,距离上一部《为什么中国没出Facebook》已过去了五年。很难想象,自上世纪90年代中期留美归国后,就先后在中公网及其所属联众游戏网站、互联网实验室等知名企业担任CEO、董事等职务,曾担任和讯网CEO和雅虎中国总裁等职的业界大咖,频繁在各大纸媒撰文发表业界观察和产业心得的人,在出书这个举动上却如此“惜字如金”。但或许也正是如此,使阅读谢文作品成了一种智性训练和与智者的对话。在谢文冷静、平和的文字背后,体现了他作为中国互联网发展数朝元老的老练沉稳,这种面对汹涌浪潮波澜不惊的定力,除了来自专业理性的思考,便是长年累月、一以贯之的行业沉淀。
按照架构,《大数据经济》旨在向公众澄清有关大数据的一些谬误,正本清源、回归真相。而主体内容则收录了谢文从2012年上半年起至今陆陆续续写的一系列关于大数据现象的专栏文章。虽然每篇议题各有侧重、篇幅也长短不一,但核心绕不开以下几个论点:第一,时下,对大数据的概念界定实际上仍然模糊不清、模棱两可;第二,当前大数据实践都还属于摸着石头过河的阶段,这符合产业发展规律,大体来看,第一波创新尝试集中在网络业、制造业和公共服务业以及三者之间的融合互动上;第三,大数据是一种世界观、历史观、价值观、方法论;第四,数据服务将是未来,而数据共享与公开将是大数据蓝海的历史使命。当然,他更不否认接下来的第五点:大数据时代对社会现有结构、体制、文化和生活方式的冲击与变革远大于计算机时代和互联网时代。“现在正是大数据带来的大变革的前夜,面对这场势将席卷全球的社会大变革,主动比被动好,早动比晚动好,不动不是一个选择。”
仅就这些观点而论,谢文其实并不孤单,就拿国内来说吧,至少像《决战大数据》的作者车品觉、《大数据》和《数据之巅》的作者涂子沛等几位,都与他“英雄所见略同”。
此外,我们也看到了谢文的忧虑。在书中他忧心忡忡地指出,大数据是整个Web2.0革命的重要组成部分,世界网络业的领军公司,例如Google、Facebook、苹果和亚马逊已占据了先发的位置。我国网络业中哪家公司能急起直追,谁就是先行者,否则,就只能扮演受害者的角色了。至于未来的战略方向,谢文建议有识之士重视数据服务业,数据服务业和现有的相关产业的根本区别在于其商业模式是数据驱动型,是对大数据的深度分析加工,是对大数据的多重利用和深度利用,是对现有简单直接商业模式的增值服务。《大数据经济》提到,包括苹果公司和谷歌在内的世界巨头,都在不计成本地全方位增加生产和获取大数据,就是为了在走向数据服务业的过程中赢得先发优势,为未来的领先地位在下一盘很大的棋。
谢文为此毫不客气地批评国内公司一拥而上生产智能手机的现象:“如果自身没有成熟配套的操作系统、开放平台、云计算后台和数据分析加工平台,单兵突进只做手机,也许在某个时段能赚点钱,但从长远看是没有前途的。那些在手机首页集成点自己的服务,高呼抢占网络入口口号的伎俩,在滚滚而来的大数据洪流面前显得那么苍白无力。何不舍弃鸡肋,重新定位,发挥优势,争取不在大数据时代掉队呢?”商业、资本固然有“趋利性”的一面,也就是什么赚钱做什么,而谢文的洞见在于,“趋利性”与“趋势性”并不矛盾,而后者是谋定而后动,去做一些更长远、更深远的产业布局。很可惜,并没有多少人能意识得到这一层,而这恰恰也回应了他当年的“谢氏之问”——为什么中国没有Facebook?
客观地讲,由于《大数据经济》是谢文之前媒体专栏文章的结集,因而在时效性上多少有点欠缺,即便国务院印发的《促进大数据发展行动纲要》也才大半年前的事,但互联网风向转变之快,已不是三五年为一个周期的“后浪推前浪”了。另外,本书还收录了其他非“大数据”主题的文章,议题从移动互联网创新到“互联网+”再到宽带战略、公司研究等等,内容难免显得有些繁杂。不过,鉴于谢文十几年如一日跟踪中国互联网产业的发展步态,锲而不舍地发些看似不合时宜的声音,他的作品仍被笔者列在必读范畴之内。至于媒体把他尊称为“中国的凯文·凯利”,则未免有些不着边际。谢文从来不输出技术哲学,也不信奉先验主义,他只是在持续不断地讲述常识。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04