京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据就是未来的新石油
互联网时代,数据无处不在。当我们使用搜索引擎,在微信与人互动,或享受打车软件的便利时,都在产生和分享社交数据。数据总量的指数增长让人们觉察:数据为我们造福的时代已经到来。
近日,《大数据和我们》由中信出版集团出版,作者安德雷斯·韦思岸(Andreas Weigend)是美国大数据和消费行为专家。近一段时间,他正携自己的新书在北京、上海等城市作巡回演讲,传播他的数据心得。近日,长江日报记者在上海专访韦思岸,他结合研究和观察告诉我们,数据将让我们的生活变得更有质量。
写书劝大家分享隐私
韦思岸曾任美国亚马逊首席科学家,在斯坦福大学、加州大学伯克利分校及复旦大学任教。过去10年来,他保持着一个习惯,将自己的每一场讲座和演讲,以及乘坐的航班信息都发布在个人网页上,甚至包括航班座位号。“我相信,分享数据可获得实际价值”。
身处大数据前沿,韦思岸发现一个现象:人们非常害怕失去隐私,不停抱怨隐私被人窥探,却又想得到更多、更精细的服务。“必须写本书告诉人们,这种思维要改变。”2012年韦思岸就萌生了写《大数据和我们》的想法。
韦思岸提出,在社交数据泛滥的世界里,旧的规则已不适用。收发电子邮件、上社交网站、打开导航系统、使用计步器等感应装备、用手机查天气预报等普通行为都会产生数据,并被数据公司记录。通过提炼这些数据,可以发现人们的偏好或倾向,还能做出预测,比如人们可能会购买何种商品等,基于分析结果,能为用户提供贴心、实用的服务;相应的,普通人也能因利用数据受益,“我们可以基于这些数据做出决策,让数据为生活服务”。
“100年来,我们一直珍视隐私权,但现在,我们必须认识到,隐私权其实只是一个幻象。”韦思岸通过自己的书告诉大家,数据公司对我们个人数据记录得越多,我们的存在感越强,更利于作出准确的决策。“如果你希望从数据中获利,就必须分享自己的数据”。
“猜你可能还想买”的创意来自他
如今,我们在网上购物常常可以看到“猜你想买”“你可能还想买”之类的提示,最先想到提供这种服务的人正是韦思岸。
2002年的一天,韦思岸接到亚马逊首席执行官贝佐斯的一个电话,对方表示想雇佣他。“人们会好奇,为什么会有人雇佣一个物理学博士来做电商呢?因为物理学家知道怎样做实验,怎样收集数据又怎样解读数据”。
担任亚马逊首席科学家期间,韦思岸与贝佐斯共同制定了该公司数据战略——以客户为中心。韦思岸主导开展了一系列实验,比如比较哪些商品评论更能让客户开心,用哪种方式为客户推荐商品成功率更高等。他还分析顾客与网站达成的每一桩交易,分析他们的购买地点、商品品种、消费金额等数据,进行分析得出结果,可用于为顾客推荐合适的商品。于是,亚马逊在此基础上开发了自己的商品推荐系统。
“猜你想买”,亚马逊的数据挖掘改变了10亿人的购物习惯。
在过去10年中,韦思岸还为汉莎航空、百思买、腾讯、阿里工作。“经验告诉我,在这个时代,人们正在将数据转化为服务”。
想办法让数据分享变得平等
“当我们认识到数据的价值后,重点不仅是获得数据,而是要主动行动。”韦思岸发现,因为技术差异、信息不对等,现实生活中,普通人想与企业实现数据平等分享很难。如何避免社交数据被滥用?韦思岸认为,透明性与主动性原则最能保护我们免受伤害,提高我们从中得到的价值。
“你需要了解你提供的数据与你得到的数据是否对等。”在《大数据和我们》中,韦思岸教读者如何与企业客服打交道:当我们打通客服电话时会听到“为保证服务质量,本次通话可能会被录音。”我们应该对他们说,我也会为此次通话录音,以保证我所获得的服务质量。
前不久,在“2016陆家嘴金融全球峰会”上,韦思岸在演讲中分享了个人网络用户的6项权利,为普通人合理利用数据支招。
首先是查看数据、获取数据的权利。比如在淘宝网上查看所有的交易记录、购物趋势以便你做出更好的选择;第二是看到数据加工的过程,我们可以分析百度是如何进行数据汇总、提炼的,也可以观察蚂蚁金服是怎样计算你的积分,以便帮你做出更好的决策。
再就是修改数据的权利,也就是你有权对自己的数据增添删改。你还可以将数据模糊处理,根据用途决定所提供数据的精度,比如分享自己的位置是精确到方圆1米还是1公里,求职时个人信息提供是否需要面面俱到。
“事在人为,只要你愿意。”他说。
︻访谈︼
“每个人都可以成为数据高手”
记者宋磊 翻译赵媛
安德雷斯·韦思岸
“数据用不好不是技术差,是因为惰性”
读+:你经常为企业出谋划策,但在书中你更多站在普通用户一边,这是为什么?
韦思岸:确实,我有很多在企业工作的经验,越是这样,我越觉得,如果没有普通人利用它们产生的数据,这些企业将失去存在的意义。比如,人们如果不是体验到在亚马逊购物的便利,在这个平台购物,亚马逊不会存在。
以前,我花了很多时间在如何帮助企业善用数据上,让客户能得到更多快乐的体验。大数据会引起巨大的革命。以前,我曾看过一本叫《身体和我们》的书,我认为,数据和我们的关系在今天如此重要,不亚于身体对我们的重要性。
读+:你提出人们要努力培养“数据素养”,那是个什么素养?
韦思岸:不能充分、有效利用数据,是不是因为人们不够勤奋、不够聪明呢?不是,其实是因为惰性。在做一件事时,人们通常会选择最简便、快捷的方式,而忽略了很多更重要的事情,比如安全。很多人将银行卡、电脑密码设置成123456,这样做隐患很大。
“数据素养”不是指素质或习惯,而是一种自觉的意识。包括了解数据服务商的工作机制,知道哪些参数可以改变或不可改变,善于改正错误,了解不确定因素,以及分享社交数据可能会带来哪些结果等技能。在当今世界,数据服务商的推荐意见、分析结果对我们大多数决策都有引导作用,因此数据素养必不可少。
数据是新世纪最重要的原材料
读+:你新书封面有一句宣传语“数据是未来的新石油”,数据与石油有何联系?
韦思岸:在今天,让数据为人类造福的需求具有无以复加的重要性。作为21世纪最重要的原材料,数据就是石油。
一个多世纪以来,石油的发现、开采技术的进步,对社会、经济产生深远影响。人们通过提取、储存和精炼,把石油变成人类需要的各种产品。现在,由原始数据转变而成的产品和服务,正在改变我们的生活,其影响力足以与工业革命媲美。
读+:但数据和石油毕竟有不同之处吧?
韦思岸:石油总量是有限的,剩余的石油资源越少,开采成本越高。与之相反,数据量呈指数增长趋势,而数据交流与处理所需的成本却在不断下降。我们每次使用电话时,就会产生数据,与石油不同,数据永远不会枯竭。
此外,一份原油只有一个实体拥有使用权,或只能提炼一种产品;而一个数据库,多个实体可以同时接入,并且创造出多个不同的产品。
读+:数据必须加工才能为我们所用吗?
韦思岸:很对,不是所有的数据都有用,有些数据会迷惑、误导我们。前不久,我知道有“东北大拉皮”这道菜,但我不知道菜名的意思,当我用网络工具翻译这个词时,让我吓了一跳——“东北的皮肤”,显然,我得到的数据不适用。
数据是有时效的,比如我今天在上海,这个数据只是暂时有效,当我过几天离开后,这个数据就是无效、错误的。同样,大众点评网、淘宝网也有很多不实的评价。
因此,我们在利用数据时,还要了解更多相关数据,作为辅助,并尽可能精确。你还应该知道哪些数据合情合理,哪些数据是虚假的。人不要被数据主导,而应以需求主导。
因为害怕泄露隐私而封闭自己不可取
读+:“猜你想买”的确帮助人们开拓了购买想象力,但也让很多人心理不适。你怎么看?
韦思岸:解决这样一个问题,可能更多需要心理学家参与,而不是数据科学家。如何在隐私的共享得到好处,而不至于被侵犯?要分清何时需要提供,何时需要说不。在提供隐私数据时,我们要了解,隐私的提供能给自己带来多大好处,与自己所需要的服务有没有相关性,你不需要提供不必要的隐私。比如,打车软件需要了解你的位置、目的地很正常,但如果需要你的婚姻状况,那便是侵犯隐私,你必须拒绝。
读+:当用户在网上提供个人信息,让自己得到更好的服务的同时,却也给犯罪分子提供了可乘之机,这矛盾如何解决?
韦思岸:这其实是两个不同的问题,我们应该区分隐私利用和网络犯罪的含义。
当用户向企业提供自己的隐私,以获得更好的服务,那么,这些企业必须对你所提供的信息负责,让它很难泄露,包括防范黑客攻击。
但是不是因为隐私有可能泄露、共享,我们就拒绝提供呢?不能一概而论。在很多情况下,你向企业提供了个人数据,虽然有些数据被用来企业间共享,但大都会给你带来回报——更高效的服务、更少的花销,这便是隐私利用;但企业不注意网络安全保护,黑客可能盗用账户密码,或冒用用户身份证贷款,造成严重经济损失,这又是另一个层面的事了。
有人会说,我们提供隐私数据需要索要报酬,其实他们已经得到了报酬。比如美国某网站将所有利润分给用户,每名用户当年可分得3.5美元,那么,一个好用的社交平台在你心中的价值是不是高于3.5美元呢?
如果你回答是,那么,已经有人为你的数据付费了。
读+:如今,很多企业在搜集、整合、分析人们的数据,需要担心吗?
韦思岸:与其担心不如从容,因为你的担心是没有用的,你永远无法知道那些数据服务商有多强大。我们可以把社交数据的挖掘程序视为神秘的“黑匣子”。我们不应花费精力去担心数据可能被企业利用,而应该全神贯注,充分利用数据服务商的产品,使数据分享尽可能在积极与消极间取得平衡。
普通人也可让数据发挥神奇作用
读+:普通人利用数据的能力小得多,渠道也很单一,难道我们只能甘于处于下风、被动状态吗?
韦思岸:事实并非这样,普通人也有能力去发掘一些看起来不可思议的数据。
美国旧金山有家数据公司,它掌握了大量职场人士信息,包括他们的工作经历、业绩、财务状况等,以此为其他公司提供有偿服务。但是,这个关系是可以反转的。如果你的信息被他们掌握并利用,你就可以通过信息的输出渠道、经过找到有用数据,再将这些数据整合、分析,你能知道这家公司的工作方式、数据的用途和输出方向,并有可能窥探到更多企业的信息,为自己所用。
世界很奇妙,数据在产生、使用上总是双向的,我们要学会在数据背后挖掘更多更有用的信息。
读+:未来,当我们充分利用数据时,还会有哪些惊喜?
韦思岸:这需要问我们自己了,除得到买东西更物美价廉,求职交友更靠谱等等之外,我们还需要什么?还期待数据给你带来怎样的惊喜?
对于个人来说,数据最大的价值是帮助你作出更正确的决策,这适用于任何时间、任何状况下。所以,数据几乎能及你之所及的,只要想得到的,数据都能办到。但前提是你必须学会整合数据——利用一切可用的信息。通过整合,能找出更多隐藏的信息,为我们服务。
圣诞节前一天,记者走进韦思岸上海的家。他将一个小盒状仪器接通电脑,并告诉记者,“我乐意将自己的生活公之于众”。
2012年,韦思岸买下上海某居民小区一套约80平方米的房子,每年都会在此住一个月。除了到大学讲课、到企业分享数据经验外,他会用滴滴打车、大众点评和微信。在他看来,在不同国家体验不同的社交网络平台、不同的数据共享感受非常必要,也很有趣。
韦思岸的工作台相当拥挤,并排摆了三个液晶显示器,一台平板电脑,平时,他会在这里上传数据、搜索数据。“相比数据科学家,我更愿意把自己称作数据侦探”。
韦思岸具有一种能力,能在浩如烟海的数据中甄别优劣,找到真正有用的数据。他知道数据来源,也知道数据间的关系,在他看来,数据科学包罗万象,涵盖生物学、商业、心理学等方方面面,“要厘清各方面的关系,必须充满好奇心”。
采访结束后,韦思岸把记者带到他的电脑前,打开某搜索引擎,展示他近10年任意一天的行踪,如数家珍。他还打开某知名网站,展示他的朋友、朋友的朋友,并翻出多年前的聊天记录,开怀大笑。
“太不可思议了,那些并不相干的人们,通过数据产生联系,并共享数据带来的好处和惊喜,我有幸参与其中,妙不可言。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01