京公网安备 11010802034615号
经营许可证编号:京B2-20210330
对于大数据存在多少偏见乃至误读呢
近几年,得益于资本追捧、企业造势、媒体推广以及公众往往跟风式参与,一些新概念或被引进、或被改造、或被提炼,其中代表性的有:大数据、互联网思维、“互联网+”、云计算、智慧城市、媒体融合、人工智能、IP、VR/AR等。其传播套路(流行持久度)大致为:今天你爆红,明日我当道,各领风骚真热闹。只是,在一阵阵浮躁、喧嚣与狂热的背后,这些新概念究竟有多少真正被正确理解了,而又有多少存在偏见乃至误读呢?
特别值得说说的,首推大数据。
对这个舶来的、随着2012年在有着“大数据商业应用第一人”之称的维克托·舍恩伯格那本全球级畅销书《大数据时代》隆重登场的新概念,先是在国内的互联网业界刮起一阵超级旋风,继而风靡了整个社会,由科技界的热门词变身为社会高频词,人人争说大数据,唯恐掉队落伍。说得更尖锐些,和绝大多数“新概念”一样,“大数据”已经成了许多闭门造车者竭尽全力宣扬的主题。这种现象与2005年盛极一时的Web2.0革命论如出一辙。那么,结果如何呢?在“中国互联网老兵”谢文看来,“一个概念,无论它可以抽象到多么高深的程度,其形成、演变、推广的过程往往却很实在、具体,充斥着不同社会力量的博弈。这个概念的对错与否、生命力的长短、对社会的影响往往不取决于概念本身,而在于它的社会价值”。因此他得出结论,“关于大数据,你知道的都不对!”
《大数据经济》是谢文的第二本书,距离上一部《为什么中国没出Facebook》已过去了五年。很难想象,自上世纪90年代中期留美归国后,就先后在中公网及其所属联众游戏网站、互联网实验室等知名企业担任CEO、董事等职务,曾担任和讯网CEO和雅虎中国总裁等职的业界大咖,频繁在各大纸媒撰文发表业界观察和产业心得的人,在出书这个举动上却如此“惜字如金”。但或许也正是如此,使阅读谢文作品成了一种智性训练和与智者的对话。在谢文冷静、平和的文字背后,体现了他作为中国互联网发展数朝元老的老练沉稳,这种面对汹涌浪潮波澜不惊的定力,除了来自专业理性的思考,便是长年累月、一以贯之的行业沉淀。
按照架构,《大数据经济》旨在向公众澄清有关大数据的一些谬误,正本清源、回归真相。而主体内容则收录了谢文从2012年上半年起至今陆陆续续写的一系列关于大数据现象的专栏文章。虽然每篇议题各有侧重、篇幅也长短不一,但核心绕不开以下几个论点:第一,时下,对大数据的概念界定实际上仍然模糊不清、模棱两可;第二,当前大数据实践都还属于摸着石头过河的阶段,这符合产业发展规律,大体来看,第一波创新尝试集中在网络业、制造业和公共服务业以及三者之间的融合互动上;第三,大数据是一种世界观、历史观、价值观、方法论;第四,数据服务将是未来,而数据共享与公开将是大数据蓝海的历史使命。当然,他更不否认接下来的第五点:大数据时代对社会现有结构、体制、文化和生活方式的冲击与变革远大于计算机时代和互联网时代。“现在正是大数据带来的大变革的前夜,面对这场势将席卷全球的社会大变革,主动比被动好,早动比晚动好,不动不是一个选择。”
仅就这些观点而论,谢文其实并不孤单,就拿国内来说吧,至少像《决战大数据》的作者车品觉、《大数据》和《数据之巅》的作者涂子沛等几位,都与他“英雄所见略同”。
此外,我们也看到了谢文的忧虑。在书中他忧心忡忡地指出,大数据是整个Web2.0革命的重要组成部分,世界网络业的领军公司,例如Google、Facebook、苹果和亚马逊已占据了先发的位置。我国网络业中哪家公司能急起直追,谁就是先行者,否则,就只能扮演受害者的角色了。至于未来的战略方向,谢文建议有识之士重视数据服务业,数据服务业和现有的相关产业的根本区别在于其商业模式是数据驱动型,是对大数据的深度分析加工,是对大数据的多重利用和深度利用,是对现有简单直接商业模式的增值服务。《大数据经济》提到,包括苹果公司和谷歌在内的世界巨头,都在不计成本地全方位增加生产和获取大数据,就是为了在走向数据服务业的过程中赢得先发优势,为未来的领先地位在下一盘很大的棋。
谢文为此毫不客气地批评国内公司一拥而上生产智能手机的现象:“如果自身没有成熟配套的操作系统、开放平台、云计算后台和数据分析加工平台,单兵突进只做手机,也许在某个时段能赚点钱,但从长远看是没有前途的。那些在手机首页集成点自己的服务,高呼抢占网络入口口号的伎俩,在滚滚而来的大数据洪流面前显得那么苍白无力。何不舍弃鸡肋,重新定位,发挥优势,争取不在大数据时代掉队呢?”商业、资本固然有“趋利性”的一面,也就是什么赚钱做什么,而谢文的洞见在于,“趋利性”与“趋势性”并不矛盾,而后者是谋定而后动,去做一些更长远、更深远的产业布局。很可惜,并没有多少人能意识得到这一层,而这恰恰也回应了他当年的“谢氏之问”——为什么中国没有Facebook?
客观地讲,由于《大数据经济》是谢文之前媒体专栏文章的结集,因而在时效性上多少有点欠缺,即便国务院印发的《促进大数据发展行动纲要》也才大半年前的事,但互联网风向转变之快,已不是三五年为一个周期的“后浪推前浪”了。另外,本书还收录了其他非“大数据”主题的文章,议题从移动互联网创新到“互联网+”再到宽带战略、公司研究等等,内容难免显得有些繁杂。不过,鉴于谢文十几年如一日跟踪中国互联网产业的发展步态,锲而不舍地发些看似不合时宜的声音,他的作品仍被笔者列在必读范畴之内。至于媒体把他尊称为“中国的凯文·凯利”,则未免有些不着边际。谢文从来不输出技术哲学,也不信奉先验主义,他只是在持续不断地讲述常识。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22