京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代预言家:互联网将把人类带向何处
21年过去,中国互联网的发展超乎了当年所有人的想象。在信息和数据引领的互联网时代,无论在中国还是世界其他地方,我们历经数载,真的已然掌握了互联网精髓?人类将如何继续发展互联网,还是说,互联网将把人类带向何处?
第二届世界互联网大会昨天在乌镇揭幕,本报独家专访了《大数据时代》的联合作者之一、被誉为“大数据时代预言家”的英国牛津大学网络学院互联网研究所教授维克托·迈尔-舍恩伯格。在长期研究互联网治理与监管的他眼中,网络时代相比人类漫长的历史只是沧海一粟。对于互联网将如何深刻变革人类的经济与社会,我们依旧知之甚少。
没有任何一种科技会绑架我们
“互联网通过给计算机添加通信功能而改变了世界,但多年过去,很多人仍以为互联网只是让沟通变快了些。”迈尔-舍恩伯格说,在研究中他经常发现,在各个行业里,都存在仍旧只把互联网当做与客户快速交流工具的人,并且这样想的人迄今仍不在少数。
但是,这些人无疑是错了。“如果继续这样认为,那么不出几年,这些人就会被市场淘汰。”迈尔-舍恩伯格给出的原因很简单:今天,互联网影响力已经彻底覆盖我们的生活。
既然能耐已经强大到可以无处不在,那么问题就来了——互联网是否已经彻底绑架了我们的生活?随处可见的“低头族”似乎就是最好例证。
不过,迈尔-舍恩伯格表示,这又是人们对互联网的误解,他并不认为人类会对互联网存在过度的依赖。
“没有任何一种科技会绑架我们,只要我们愿意,我们永远是未来的掌控者。”鉴于此,迈尔-舍恩伯格希望人类未来能更加关注事实和数据,用此二者来为经济社会发展做出更好的决策。
事实上,迈尔-舍恩伯格也认同,互联网横空出世后很长一段时间里,都只是一项崭新的技术,并没有“灵魂”,也没有所谓的“互联网精神”。但当“智能”、“数据”等概念逐渐脱颖而出时,互联网的运用也脱离了单纯的技术意义,上升到了新的境界。
大数据究竟是什么
谈到“大数据”,对于这个经常与“互联网”一起打包出现的名词,迈尔-舍恩伯格开门见山地表示,人们对大数据也存在不少误解,最大误解就是“大数据只是一项新技术”。如果用传统的观念去理解大数据,我们不仅会错失大数据自身具备的深刻洞见和巨大优势,甚至会对大数据的分析结果产生错误的理解。
那么大数据究竟是什么?
在迈尔-舍恩伯格与肯尼思·库克耶(《经济学人》数据编辑)共同撰写的《大数据时代》中,他们二人指出,大数据并非某一个确切的概念。最初,大数据的出现是由于某些需要处理的信息量过大,超越了一般计算机在处理数据时能够使用的内存量,因而工程师们必须改进数据处理工具,新处理技术也就孕育而生。
由于互联网公司有能力搜集大量有价值的数据,且背后有强大的利益驱动,所以互联网公司顺理成章地最先成为了最新数据处理技术的使用者。正因如此,很多人担心,掌握了大量数据的互联网公司是否会用现有数据解析其他个人信息,达成某些我们想象不到的商业目的。
迈尔-舍恩伯格表示,据他了解,的确有公司存在滥用数据分析的现象。这也是为何他非常强调通过立法来监管个人信息的使用尤为重要。他表示,一些数据只有在监管严格的情况下才能够被允许使用,而通过法律途径监管数据,远比直接限制或叫停数据流要好得多。
“试想一下,如果能通过分析我的健康数据,为我生病的孩子找到致病成因和治疗方法,这或许是所有人都喜闻乐见的。然而,如果是利用我的健康数据来蓄意提高我的医疗保险成本,这是我要拒绝的。”
他认为,大数据本身并没有错,错误的是使用方法。当互联网的能量愈发强大,我们也就必须更加努力地去避免被诱惑,更敏锐地发现它的美中不足。
人类对于互联网的误读,也部分源自对人类自身的不了解。
任何垄断永远都只是暂时的
虽然迈尔-舍恩伯格认为互联网不会绑架人们的生活,但是互联网“杀掉”了人们更多的时间却是事实。有调查数据显示,BAT(百度、阿里巴巴、腾讯)在中国整个网民的覆盖率里面占到了90%以上,这三家所有APP的时长,加起来占到整个网民消耗时长的50%。
对此,迈尔-舍恩伯格表示:“这种情况在哪儿都一样。”在美国,人们一样每天会有无数时间花在脸书和谷歌上,包括在Youtube(2006年被谷歌收购)长时间观看视频。
“我们唯一需要关心的应该是,会否有下一个百度、阿里巴巴、腾讯诞生。”在任何由创新驱动的行业里,都会出现垄断。但正是因为创新层出不穷,任何垄断永远都只是暂时的。
在美国,许多著名的互联网公司都曾被认为是垄断,但如今他们中的许多影响力都不复以往。
以谷歌街景服务为例,谷歌的图像采集车在许多国家采集了道路和房屋的影像,以及很多备受争议的数据。在一些国家,业主们不希望自家房屋或是花园出现在谷歌街景的影像中,于是谷歌迫不得已,顶着巨大压力,将这些业主的房屋或是花园做了影像模糊处理。但问题是,对于意图犯罪的盗贼来说,这样的马赛克,无异于此地无银三百两。
但是,如果其他公司有一项技术,能同时具备街景的实用,并符合所有人的安全考量,那么谷歌的地位就势必受到挑战——只是,暂时大家还不知晓是否有这样的技术存在。垄断与创新的关系,就是后者对前者的制约。
“只要垄断是暂时的,且创新机遇一直存在,人们就无需担心互联网会发生垄断。”
互联网创业“进场费”远低于以往
2012年撰写《大数据时代》时,迈尔-舍恩伯格和库克耶就提出,如今信息技术变革的重点应该在于信息本身,而不能像过去那样只关注技术。虽然大部分技术专家都认同数据的发展与计算机科技的变革是步调一致的,但今天,好的内容传递已经成为变革真正的推动力。
迈尔-舍恩伯格表示,现在是互联网创业、数据创业的好时代,尤其是在中国。他认为,在BAT三足鼎立的中国互联网格局中,年轻的互联网创业者最需要的就是坚持创新力,有自己的好点子。
事实上,一百年前人们若想创业,需要募集很久的资金才能建造一座工厂。甚至就在十年前,互联网创业者仍需融资多时才能建立一座服务器农场。“然而,今天在大数据时代,创业者需要具备的可能仅仅只是‘一个棒主意’。”迈尔-舍恩伯格说,剩下的创业需求都能以商品价格获得,比如云计算服务。
“也就是说,互联网创业的‘进场费’,在资本层面远低于以往,但对创业内容——‘金点子’的质量要求却不断提高。”迈尔-舍恩伯格表示,这样的现象“简直太好了”。
对于中国目前最炙手可热的“互联网+”,迈尔-舍恩伯格认为这是让数据大显身手的绝佳策略。
他认为,‘互联网+’的思维将任何想得到的事物都尝试与互联网发生联系,这不仅让数据有机会在更广阔的空间发挥作用,对数据搜集来说,也能接触更为多样、广泛的数据源。他说,自己并不认为中国的互联网产业发展过快,更不觉得中国的互联网发展不稳定。“如果真的有什么需要注意,那就是继续保有创新力。”
中国举办世界互联网大会今年已至第二届。迈尔-舍恩伯格说,举办互联网大会是中国向世界各国展示互联网和数字技术发展成就的绝佳机会。他期待大会能更多地关注中国互联网企业家们这些年来的成就,也希望通过这次大会,能帮助中国本土的互联网企业继续保持创新的力量。
互联网世界不存在绝对的安全
谈到互联网风险,无论是2012年著书时,还是现在,迈尔-舍恩伯格说安全问题一直是首要考虑的对象。
谷歌、亚马逊,以及阿里巴巴、华为等,都相继推出了云服务,但庞大的数据存储于这些大公司云端,是否意味着更高的安全性?
“如果有一家公司说自己的云服务绝对安全,那它简直是疯了。”迈尔-舍恩伯格表示,云安全是一个非常宏大的话题,许多互联网公司在不远的将来都必定会投入更多资金和精力在数据安全和服务安全上。因为在互联网世界中,不可能存在绝对安全;即使纵观整个人类历史,也不存在绝对之事,除了每个人都终有一死。
不过,他紧接着指出,大企业的互联网安全技术已经远好于大部分小企业,因为黑客们已经瞄准大企业多年,因而多数大企业的安全系统一直在更新换代。“真正需要担心的是小公司,尤其是一些新近创业的中小企业,他们的网络安全更需要警惕。”
为何互联网安全越来越重要?原因很简单。
迈尔-舍恩伯格表示,当越来越多的交易和人类互动都从线下转移到线上,并且愈发数字化,那么针对互联网世界的犯罪也就随之水涨船高。在互联网世界中,能以非法手段获取的财富远超线下,因而犯罪手法也就愈发复杂。同时,随着互联网技术的复杂和升级,许多小公司(包括国家和地区)的信息安全系统和安全网络已经跟不上当今潮流,不少企业和国家都处于在互联网世界“半裸奔”的状态。相比赫赫有名的大企业们,籍籍无名的小企业才更应该担心正对自己虎视眈眈的互联网风险。
对互联网的盲目崇拜也是风险
对于中国的互联网安全,迈尔-舍恩伯格延续了自己的看法,认为中国只要保持目前对互联网安全的投入趋势就好。
“我担心的反而不是中国这样的互联网大国。”他表示,对于那些互联网产业刚刚兴起的国家,安全问题对于他们来说更为重要。在他看来,正是因为互联网在这些国家还处于刚起步,加之他们对互联网安全的投入相当有限,所以,这些国家就容易成为互联网犯罪的首要潜在攻击对象。
个人信息安全也是互联网安全中最为脆弱的一环。互联网掌握人们的数据越多,个人对自身信息的掌控力就越弱,个人数据被窃取、滥用甚至用于犯罪的可能性也相对越大。
对于滥用大数据的现象,迈尔-舍恩伯格表示,如果的确存在通过大数据分析来欺骗消费者和客户的行为,那么造成这一现象的最主要原因就是买方和卖方的信息不对称。
听起来和线下交易极度相似?但是要注意,互联网诞生的一大使命就是为解决信息不对称的。迈尔-舍恩伯格说,相比线下交易,互联网上的信息不对称能够通过数据传递迅速解决,这是线下商务无法比拟的。因此,只要数据存在,人们在网上交易时,就能通过数据信息了解自己所承担价格是否合理、这笔交易究竟“值不值”。
但是,我们也不得不承认,互联网在为生活提供便利的同时,也让保护隐私的法律手段失去了掌控。
以个人数据安全为例,在《大数据时代》中曾提到,面对大数据,保护隐私的核心技术不再适用。同时,从大数据本身和大数据分析结果获益的人,可能会将大数据放到并不适用的领域,还可能过分夸大、人为提升对大数据分析结果的信赖。当然,最坏的结果,就是将大数据用于犯罪。
此外,迈尔-舍恩伯格表示,还有一大风险正在形成,但还来得及避免的,那就是对互联网的盲目崇拜。因为,互联网并不是那么的无所不能。
精确性不再是探索世界的重心
2012年,维克托·迈尔-舍恩伯格和《大数据时代》 的另一位作者肯尼思·库克耶意识到,世界上最富创新力的企业正越来越重视数据,并且数据已不再是交易的副产品,而是能增加新思维和经济效益的宝贵资源。所以,两人决定撰写一本关于大数据的书。
迈尔-舍恩伯格说,书中并不存在哪一个部分是对中国或是其他任何一个单一国家特别重要的,也不存在哪一个章节比其他更重要。“因为只有当所有概念融合在一起,这本书才有意义。”他说,如果《大数据时代》要再版,原书中没有内容需要删去,只是会多增加一些实际案例,可能会增加一章,专门讲述大数据在这三年来已经如何影响和改变各个经济领域。
谈到大数据在互联网中的运用,迈尔-舍恩伯格认为,通过互联网,大数据对人类最大的影响或许就是改变了人类探索世界的方法,而这一改变的影响力还将持续下去。
比如,人们在脸书上看到有人发了新消息,下面都会有一个“喜欢”按钮来点赞,同时也能看到有多少人也喜欢这条消息。当数量不多时,会显示诸如“13”、“109”这样的精确数字;而当点赞数量庞大时,反而只会显示一个近似值,如“6000”、“41k(41000,k表示千)”。脸书系统并非不知道确切点赞人数是多少,而是当持有相同观点的人数变得颇具规模后,具体数字已经不再重要。人们已经得到结论,并能就此趋势做出相应的判断。
两位作者在《大数据时代》中提到,谷歌的翻译之所以比其他公司的翻译服务更好,并非谷歌拥有更好的算法机制,而是增加了各式各样看似无用,甚至是错误的数据。2006年,谷歌发布的上万亿的语料库,正是来自互联网的一些“无用”的内容。而谷歌将此作为“训练集”,使谷歌翻译服务能够正确推算出英语词汇搭配的更多可能性。
可以说,谷歌的这一尝试与数据、算法已经没有特别大关联。事实上,当年的这一尝试,恰好体现了如今在中国最常被提起的“互联网思维”。如同网络新闻可以不断被更新,甚至修改,互联网的一大重要特质就是容错。当精确性不再是我们探索世界的重心,我们就必须学会接受混乱和错误的存在。“人们正变得更侧重于分析不同事物间的相关性,而不再寻求每个预测背后的原因。”迈尔-舍恩伯格说。
对于中国互联网,尤其是发展堪比宇宙速度的电商产业,迈尔-舍恩伯格说,这基本在他的预料之中,因为中国广袤的市场和消费者基数给予了电子商务发展的理想环境。任何一个新点子,或是新产品,都能通过互联网迅速传达给十亿潜在消费者,而这十亿人又说着同一种语言,生活在同一个法律体系中。
这意味着什么?“意味着只需要一晚,甚至更短时间,好的想法、好的产品,就能让亿万人知道。”这在其他任何一个国家都无法想象,也是无法达到的规模。
三年前,迈尔-舍恩伯格和库克耶曾表示,当人类准备开发电子商务、寓生活于互联网、进入计算机时代或者拿起算盘时,这些行为的产生比背后存在的问题更加重要。
三年过去,互联网世界的变化速度与日俱增,但万变之中有一点不曾变过。“通过互联网,大数据将改变一切,可能超越我们所有人的想象。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户行为数据已成为企业的核心资产之一。从用户打开APP的首次点击,到浏览页面的停留时长,再到最终的购买决策、 ...
2026-01-04在数据分析领域,数据稳定性是衡量数据质量的核心维度之一,直接决定了分析结果的可靠性与决策价值。稳定的数据能反映事物的固有 ...
2026-01-04在CDA(Certified Data Analyst)数据分析师的工作链路中,数据读取是连接原始数据与后续分析的关键桥梁。如果说数据采集是“获 ...
2026-01-04尊敬的考生: 您好! 我们诚挚通知您,CDA Level III 考试大纲将于 2025 年 12 月 31 日实施重大更新,并正式启用,2026年3月考 ...
2025-12-31“字如其人”的传统认知,让不少“手残党”在需要签名的场景中倍感尴尬——商务签约时的签名歪歪扭扭,朋友聚会的签名墙不敢落笔 ...
2025-12-31在多元统计分析的因子分析中,“得分系数”是连接原始观测指标与潜在因子的关键纽带,其核心作用是将多个相关性较高的原始指标, ...
2025-12-31对CDA(Certified Data Analyst)数据分析师而言,高质量的数据是开展后续分析、挖掘业务价值的基础,而数据采集作为数据链路的 ...
2025-12-31在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30数据透视表是数据分析中高效汇总、多维度分析数据的核心工具,能快速将杂乱数据转化为结构化的汇总报表。在实际分析场景中,我们 ...
2025-12-30在金融投资、商业运营、用户增长等数据密集型领域,量化策略凭借“数据驱动、逻辑可验证、执行标准化”的优势,成为企业提升决策 ...
2025-12-30CDA(Certified Data Analyst),是在数字经济大背景和人工智能时代趋势下,源自中国,走向世界,面向全行业的专业技能认证,旨 ...
2025-12-29在数据分析领域,周期性是时间序列数据的重要特征之一——它指数据在一定时间间隔内重复出现的规律,广泛存在于经济、金融、气象 ...
2025-12-29数据分析师的核心价值在于将海量数据转化为可落地的商业洞察,而高效的工具则是实现这一价值的关键载体。从数据采集、清洗整理, ...
2025-12-29在金融、零售、互联网等数据密集型行业,量化策略已成为企业提升决策效率、挖掘商业价值的核心工具。CDA(Certified Data Analys ...
2025-12-29CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-26在数字化转型浪潮下,审计行业正经历从“传统手工审计”向“大数据智能审计”的深刻变革。教育部发布的《大数据与审计专业教学标 ...
2025-12-26统计学作为数学的重要分支,是连接数据与决策的桥梁。随着数据规模的爆炸式增长和复杂问题的涌现,传统统计方法已难以应对高维、 ...
2025-12-26数字化浪潮席卷全球,数据已成为企业核心生产要素,“用数据说话、用数据决策”成为企业生存与发展的核心逻辑。在这一背景下,CD ...
2025-12-26箱线图(Box Plot)作为数据分布可视化的核心工具,凭借简洁的结构直观呈现数据的中位数、四分位数、异常值等关键信息,广泛应用 ...
2025-12-25在数据驱动决策的时代,基于历史数据进行精准预测已成为企业核心需求——无论是预测未来销售额、客户流失概率,还是产品需求趋势 ...
2025-12-25