京公网安备 11010802034615号
经营许可证编号:京B2-20210330
对于大数据存在多少偏见乃至误读呢
近几年,得益于资本追捧、企业造势、媒体推广以及公众往往跟风式参与,一些新概念或被引进、或被改造、或被提炼,其中代表性的有:大数据、互联网思维、“互联网+”、云计算、智慧城市、媒体融合、人工智能、IP、VR/AR等。其传播套路(流行持久度)大致为:今天你爆红,明日我当道,各领风骚真热闹。只是,在一阵阵浮躁、喧嚣与狂热的背后,这些新概念究竟有多少真正被正确理解了,而又有多少存在偏见乃至误读呢?
特别值得说说的,首推大数据。
对这个舶来的、随着2012年在有着“大数据商业应用第一人”之称的维克托·舍恩伯格那本全球级畅销书《大数据时代》隆重登场的新概念,先是在国内的互联网业界刮起一阵超级旋风,继而风靡了整个社会,由科技界的热门词变身为社会高频词,人人争说大数据,唯恐掉队落伍。说得更尖锐些,和绝大多数“新概念”一样,“大数据”已经成了许多闭门造车者竭尽全力宣扬的主题。这种现象与2005年盛极一时的Web2.0革命论如出一辙。那么,结果如何呢?在“中国互联网老兵”谢文看来,“一个概念,无论它可以抽象到多么高深的程度,其形成、演变、推广的过程往往却很实在、具体,充斥着不同社会力量的博弈。这个概念的对错与否、生命力的长短、对社会的影响往往不取决于概念本身,而在于它的社会价值”。因此他得出结论,“关于大数据,你知道的都不对!”
《大数据经济》是谢文的第二本书,距离上一部《为什么中国没出Facebook》已过去了五年。很难想象,自上世纪90年代中期留美归国后,就先后在中公网及其所属联众游戏网站、互联网实验室等知名企业担任CEO、董事等职务,曾担任和讯网CEO和雅虎中国总裁等职的业界大咖,频繁在各大纸媒撰文发表业界观察和产业心得的人,在出书这个举动上却如此“惜字如金”。但或许也正是如此,使阅读谢文作品成了一种智性训练和与智者的对话。在谢文冷静、平和的文字背后,体现了他作为中国互联网发展数朝元老的老练沉稳,这种面对汹涌浪潮波澜不惊的定力,除了来自专业理性的思考,便是长年累月、一以贯之的行业沉淀。
按照架构,《大数据经济》旨在向公众澄清有关大数据的一些谬误,正本清源、回归真相。而主体内容则收录了谢文从2012年上半年起至今陆陆续续写的一系列关于大数据现象的专栏文章。虽然每篇议题各有侧重、篇幅也长短不一,但核心绕不开以下几个论点:第一,时下,对大数据的概念界定实际上仍然模糊不清、模棱两可;第二,当前大数据实践都还属于摸着石头过河的阶段,这符合产业发展规律,大体来看,第一波创新尝试集中在网络业、制造业和公共服务业以及三者之间的融合互动上;第三,大数据是一种世界观、历史观、价值观、方法论;第四,数据服务将是未来,而数据共享与公开将是大数据蓝海的历史使命。当然,他更不否认接下来的第五点:大数据时代对社会现有结构、体制、文化和生活方式的冲击与变革远大于计算机时代和互联网时代。“现在正是大数据带来的大变革的前夜,面对这场势将席卷全球的社会大变革,主动比被动好,早动比晚动好,不动不是一个选择。”
仅就这些观点而论,谢文其实并不孤单,就拿国内来说吧,至少像《决战大数据》的作者车品觉、《大数据》和《数据之巅》的作者涂子沛等几位,都与他“英雄所见略同”。
此外,我们也看到了谢文的忧虑。在书中他忧心忡忡地指出,大数据是整个Web2.0革命的重要组成部分,世界网络业的领军公司,例如Google、Facebook、苹果和亚马逊已占据了先发的位置。我国网络业中哪家公司能急起直追,谁就是先行者,否则,就只能扮演受害者的角色了。至于未来的战略方向,谢文建议有识之士重视数据服务业,数据服务业和现有的相关产业的根本区别在于其商业模式是数据驱动型,是对大数据的深度分析加工,是对大数据的多重利用和深度利用,是对现有简单直接商业模式的增值服务。《大数据经济》提到,包括苹果公司和谷歌在内的世界巨头,都在不计成本地全方位增加生产和获取大数据,就是为了在走向数据服务业的过程中赢得先发优势,为未来的领先地位在下一盘很大的棋。
谢文为此毫不客气地批评国内公司一拥而上生产智能手机的现象:“如果自身没有成熟配套的操作系统、开放平台、云计算后台和数据分析加工平台,单兵突进只做手机,也许在某个时段能赚点钱,但从长远看是没有前途的。那些在手机首页集成点自己的服务,高呼抢占网络入口口号的伎俩,在滚滚而来的大数据洪流面前显得那么苍白无力。何不舍弃鸡肋,重新定位,发挥优势,争取不在大数据时代掉队呢?”商业、资本固然有“趋利性”的一面,也就是什么赚钱做什么,而谢文的洞见在于,“趋利性”与“趋势性”并不矛盾,而后者是谋定而后动,去做一些更长远、更深远的产业布局。很可惜,并没有多少人能意识得到这一层,而这恰恰也回应了他当年的“谢氏之问”——为什么中国没有Facebook?
客观地讲,由于《大数据经济》是谢文之前媒体专栏文章的结集,因而在时效性上多少有点欠缺,即便国务院印发的《促进大数据发展行动纲要》也才大半年前的事,但互联网风向转变之快,已不是三五年为一个周期的“后浪推前浪”了。另外,本书还收录了其他非“大数据”主题的文章,议题从移动互联网创新到“互联网+”再到宽带战略、公司研究等等,内容难免显得有些繁杂。不过,鉴于谢文十几年如一日跟踪中国互联网产业的发展步态,锲而不舍地发些看似不合时宜的声音,他的作品仍被笔者列在必读范畴之内。至于媒体把他尊称为“中国的凯文·凯利”,则未免有些不着边际。谢文从来不输出技术哲学,也不信奉先验主义,他只是在持续不断地讲述常识。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22