
大数据就是未来的新石油
互联网时代,数据无处不在。当我们使用搜索引擎,在微信与人互动,或享受打车软件的便利时,都在产生和分享社交数据。数据总量的指数增长让人们觉察:数据为我们造福的时代已经到来。
近日,《大数据和我们》由中信出版集团出版,作者安德雷斯·韦思岸(Andreas Weigend)是美国大数据和消费行为专家。近一段时间,他正携自己的新书在北京、上海等城市作巡回演讲,传播他的数据心得。近日,长江日报记者在上海专访韦思岸,他结合研究和观察告诉我们,数据将让我们的生活变得更有质量。
写书劝大家分享隐私
韦思岸曾任美国亚马逊首席科学家,在斯坦福大学、加州大学伯克利分校及复旦大学任教。过去10年来,他保持着一个习惯,将自己的每一场讲座和演讲,以及乘坐的航班信息都发布在个人网页上,甚至包括航班座位号。“我相信,分享数据可获得实际价值”。
身处大数据前沿,韦思岸发现一个现象:人们非常害怕失去隐私,不停抱怨隐私被人窥探,却又想得到更多、更精细的服务。“必须写本书告诉人们,这种思维要改变。”2012年韦思岸就萌生了写《大数据和我们》的想法。
韦思岸提出,在社交数据泛滥的世界里,旧的规则已不适用。收发电子邮件、上社交网站、打开导航系统、使用计步器等感应装备、用手机查天气预报等普通行为都会产生数据,并被数据公司记录。通过提炼这些数据,可以发现人们的偏好或倾向,还能做出预测,比如人们可能会购买何种商品等,基于分析结果,能为用户提供贴心、实用的服务;相应的,普通人也能因利用数据受益,“我们可以基于这些数据做出决策,让数据为生活服务”。
“100年来,我们一直珍视隐私权,但现在,我们必须认识到,隐私权其实只是一个幻象。”韦思岸通过自己的书告诉大家,数据公司对我们个人数据记录得越多,我们的存在感越强,更利于作出准确的决策。“如果你希望从数据中获利,就必须分享自己的数据”。
“猜你可能还想买”的创意来自他
如今,我们在网上购物常常可以看到“猜你想买”“你可能还想买”之类的提示,最先想到提供这种服务的人正是韦思岸。
2002年的一天,韦思岸接到亚马逊首席执行官贝佐斯的一个电话,对方表示想雇佣他。“人们会好奇,为什么会有人雇佣一个物理学博士来做电商呢?因为物理学家知道怎样做实验,怎样收集数据又怎样解读数据”。
担任亚马逊首席科学家期间,韦思岸与贝佐斯共同制定了该公司数据战略——以客户为中心。韦思岸主导开展了一系列实验,比如比较哪些商品评论更能让客户开心,用哪种方式为客户推荐商品成功率更高等。他还分析顾客与网站达成的每一桩交易,分析他们的购买地点、商品品种、消费金额等数据,进行分析得出结果,可用于为顾客推荐合适的商品。于是,亚马逊在此基础上开发了自己的商品推荐系统。
“猜你想买”,亚马逊的数据挖掘改变了10亿人的购物习惯。
在过去10年中,韦思岸还为汉莎航空、百思买、腾讯、阿里工作。“经验告诉我,在这个时代,人们正在将数据转化为服务”。
想办法让数据分享变得平等
“当我们认识到数据的价值后,重点不仅是获得数据,而是要主动行动。”韦思岸发现,因为技术差异、信息不对等,现实生活中,普通人想与企业实现数据平等分享很难。如何避免社交数据被滥用?韦思岸认为,透明性与主动性原则最能保护我们免受伤害,提高我们从中得到的价值。
“你需要了解你提供的数据与你得到的数据是否对等。”在《大数据和我们》中,韦思岸教读者如何与企业客服打交道:当我们打通客服电话时会听到“为保证服务质量,本次通话可能会被录音。”我们应该对他们说,我也会为此次通话录音,以保证我所获得的服务质量。
前不久,在“2016陆家嘴金融全球峰会”上,韦思岸在演讲中分享了个人网络用户的6项权利,为普通人合理利用数据支招。
首先是查看数据、获取数据的权利。比如在淘宝网上查看所有的交易记录、购物趋势以便你做出更好的选择;第二是看到数据加工的过程,我们可以分析百度是如何进行数据汇总、提炼的,也可以观察蚂蚁金服是怎样计算你的积分,以便帮你做出更好的决策。
再就是修改数据的权利,也就是你有权对自己的数据增添删改。你还可以将数据模糊处理,根据用途决定所提供数据的精度,比如分享自己的位置是精确到方圆1米还是1公里,求职时个人信息提供是否需要面面俱到。
“事在人为,只要你愿意。”他说。
︻访谈︼
“每个人都可以成为数据高手”
记者宋磊 翻译赵媛
安德雷斯·韦思岸
“数据用不好不是技术差,是因为惰性”
读+:你经常为企业出谋划策,但在书中你更多站在普通用户一边,这是为什么?
韦思岸:确实,我有很多在企业工作的经验,越是这样,我越觉得,如果没有普通人利用它们产生的数据,这些企业将失去存在的意义。比如,人们如果不是体验到在亚马逊购物的便利,在这个平台购物,亚马逊不会存在。
以前,我花了很多时间在如何帮助企业善用数据上,让客户能得到更多快乐的体验。大数据会引起巨大的革命。以前,我曾看过一本叫《身体和我们》的书,我认为,数据和我们的关系在今天如此重要,不亚于身体对我们的重要性。
读+:你提出人们要努力培养“数据素养”,那是个什么素养?
韦思岸:不能充分、有效利用数据,是不是因为人们不够勤奋、不够聪明呢?不是,其实是因为惰性。在做一件事时,人们通常会选择最简便、快捷的方式,而忽略了很多更重要的事情,比如安全。很多人将银行卡、电脑密码设置成123456,这样做隐患很大。
“数据素养”不是指素质或习惯,而是一种自觉的意识。包括了解数据服务商的工作机制,知道哪些参数可以改变或不可改变,善于改正错误,了解不确定因素,以及分享社交数据可能会带来哪些结果等技能。在当今世界,数据服务商的推荐意见、分析结果对我们大多数决策都有引导作用,因此数据素养必不可少。
数据是新世纪最重要的原材料
读+:你新书封面有一句宣传语“数据是未来的新石油”,数据与石油有何联系?
韦思岸:在今天,让数据为人类造福的需求具有无以复加的重要性。作为21世纪最重要的原材料,数据就是石油。
一个多世纪以来,石油的发现、开采技术的进步,对社会、经济产生深远影响。人们通过提取、储存和精炼,把石油变成人类需要的各种产品。现在,由原始数据转变而成的产品和服务,正在改变我们的生活,其影响力足以与工业革命媲美。
读+:但数据和石油毕竟有不同之处吧?
韦思岸:石油总量是有限的,剩余的石油资源越少,开采成本越高。与之相反,数据量呈指数增长趋势,而数据交流与处理所需的成本却在不断下降。我们每次使用电话时,就会产生数据,与石油不同,数据永远不会枯竭。
此外,一份原油只有一个实体拥有使用权,或只能提炼一种产品;而一个数据库,多个实体可以同时接入,并且创造出多个不同的产品。
读+:数据必须加工才能为我们所用吗?
韦思岸:很对,不是所有的数据都有用,有些数据会迷惑、误导我们。前不久,我知道有“东北大拉皮”这道菜,但我不知道菜名的意思,当我用网络工具翻译这个词时,让我吓了一跳——“东北的皮肤”,显然,我得到的数据不适用。
数据是有时效的,比如我今天在上海,这个数据只是暂时有效,当我过几天离开后,这个数据就是无效、错误的。同样,大众点评网、淘宝网也有很多不实的评价。
因此,我们在利用数据时,还要了解更多相关数据,作为辅助,并尽可能精确。你还应该知道哪些数据合情合理,哪些数据是虚假的。人不要被数据主导,而应以需求主导。
因为害怕泄露隐私而封闭自己不可取
读+:“猜你想买”的确帮助人们开拓了购买想象力,但也让很多人心理不适。你怎么看?
韦思岸:解决这样一个问题,可能更多需要心理学家参与,而不是数据科学家。如何在隐私的共享得到好处,而不至于被侵犯?要分清何时需要提供,何时需要说不。在提供隐私数据时,我们要了解,隐私的提供能给自己带来多大好处,与自己所需要的服务有没有相关性,你不需要提供不必要的隐私。比如,打车软件需要了解你的位置、目的地很正常,但如果需要你的婚姻状况,那便是侵犯隐私,你必须拒绝。
读+:当用户在网上提供个人信息,让自己得到更好的服务的同时,却也给犯罪分子提供了可乘之机,这矛盾如何解决?
韦思岸:这其实是两个不同的问题,我们应该区分隐私利用和网络犯罪的含义。
当用户向企业提供自己的隐私,以获得更好的服务,那么,这些企业必须对你所提供的信息负责,让它很难泄露,包括防范黑客攻击。
但是不是因为隐私有可能泄露、共享,我们就拒绝提供呢?不能一概而论。在很多情况下,你向企业提供了个人数据,虽然有些数据被用来企业间共享,但大都会给你带来回报——更高效的服务、更少的花销,这便是隐私利用;但企业不注意网络安全保护,黑客可能盗用账户密码,或冒用用户身份证贷款,造成严重经济损失,这又是另一个层面的事了。
有人会说,我们提供隐私数据需要索要报酬,其实他们已经得到了报酬。比如美国某网站将所有利润分给用户,每名用户当年可分得3.5美元,那么,一个好用的社交平台在你心中的价值是不是高于3.5美元呢?
如果你回答是,那么,已经有人为你的数据付费了。
读+:如今,很多企业在搜集、整合、分析人们的数据,需要担心吗?
韦思岸:与其担心不如从容,因为你的担心是没有用的,你永远无法知道那些数据服务商有多强大。我们可以把社交数据的挖掘程序视为神秘的“黑匣子”。我们不应花费精力去担心数据可能被企业利用,而应该全神贯注,充分利用数据服务商的产品,使数据分享尽可能在积极与消极间取得平衡。
普通人也可让数据发挥神奇作用
读+:普通人利用数据的能力小得多,渠道也很单一,难道我们只能甘于处于下风、被动状态吗?
韦思岸:事实并非这样,普通人也有能力去发掘一些看起来不可思议的数据。
美国旧金山有家数据公司,它掌握了大量职场人士信息,包括他们的工作经历、业绩、财务状况等,以此为其他公司提供有偿服务。但是,这个关系是可以反转的。如果你的信息被他们掌握并利用,你就可以通过信息的输出渠道、经过找到有用数据,再将这些数据整合、分析,你能知道这家公司的工作方式、数据的用途和输出方向,并有可能窥探到更多企业的信息,为自己所用。
世界很奇妙,数据在产生、使用上总是双向的,我们要学会在数据背后挖掘更多更有用的信息。
读+:未来,当我们充分利用数据时,还会有哪些惊喜?
韦思岸:这需要问我们自己了,除得到买东西更物美价廉,求职交友更靠谱等等之外,我们还需要什么?还期待数据给你带来怎样的惊喜?
对于个人来说,数据最大的价值是帮助你作出更正确的决策,这适用于任何时间、任何状况下。所以,数据几乎能及你之所及的,只要想得到的,数据都能办到。但前提是你必须学会整合数据——利用一切可用的信息。通过整合,能找出更多隐藏的信息,为我们服务。
圣诞节前一天,记者走进韦思岸上海的家。他将一个小盒状仪器接通电脑,并告诉记者,“我乐意将自己的生活公之于众”。
2012年,韦思岸买下上海某居民小区一套约80平方米的房子,每年都会在此住一个月。除了到大学讲课、到企业分享数据经验外,他会用滴滴打车、大众点评和微信。在他看来,在不同国家体验不同的社交网络平台、不同的数据共享感受非常必要,也很有趣。
韦思岸的工作台相当拥挤,并排摆了三个液晶显示器,一台平板电脑,平时,他会在这里上传数据、搜索数据。“相比数据科学家,我更愿意把自己称作数据侦探”。
韦思岸具有一种能力,能在浩如烟海的数据中甄别优劣,找到真正有用的数据。他知道数据来源,也知道数据间的关系,在他看来,数据科学包罗万象,涵盖生物学、商业、心理学等方方面面,“要厘清各方面的关系,必须充满好奇心”。
采访结束后,韦思岸把记者带到他的电脑前,打开某搜索引擎,展示他近10年任意一天的行踪,如数家珍。他还打开某知名网站,展示他的朋友、朋友的朋友,并翻出多年前的聊天记录,开怀大笑。
“太不可思议了,那些并不相干的人们,通过数据产生联系,并共享数据带来的好处和惊喜,我有幸参与其中,妙不可言。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26CDA 数据分析师会被 AI 取代吗? 在当今数字化时代,数据的重要性日益凸显,数据分析师成为了众多企业不可或缺的角色 ...
2025-06-26CDA 数据分析师证书考取全攻略 在数字化浪潮汹涌的当下,数据已成为企业乃至整个社会发展的核心驱动力。数据分析师作 ...
2025-06-25人工智能在数据分析的应用场景 在数字化浪潮席卷全球的当下,数据以前所未有的速度增长,传统的数据分析方法逐渐难以满足海 ...
2025-06-25评估模型预测为正时的准确性 在机器学习与数据科学领域,模型预测的准确性是衡量其性能优劣的核心指标。尤其是当模型预测结 ...
2025-06-25CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-06-24金融行业的大数据变革:五大应用案例深度解析 在数字化浪潮中,金融行业正经历着深刻的变革,大数据技术的广泛应用 ...
2025-06-24Power Query 中实现移动加权平均的详细指南 在数据分析和处理中,移动加权平均是一种非常有用的计算方法,它能够根据不同数据 ...
2025-06-24数据驱动营销革命:解析数据分析在网络营销中的核心作用 在数字经济蓬勃发展的当下,网络营销已成为企业触达消费者 ...
2025-06-23随机森林模型与 OPLS-DA 的优缺点深度剖析 在数据分析与机器学习领域,随机森林模型与 OPLS-DA(正交偏最小二乘法判 ...
2025-06-23CDA 一级:开启数据分析师职业大门的钥匙 在数字化浪潮席卷全球的今天,数据已成为企业发展和决策的核心驱动力,数据分析师 ...
2025-06-23透视表内计算两个字段乘积的实用指南 在数据处理与分析的过程中,透视表凭借其强大的数据汇总和整理能力,成为了众多数据工 ...
2025-06-20CDA 一级考试备考时长全解析,助你高效备考 CDA(Certified Data Analyst)一级认证考试,作为数据分析师领域的重要资格认证, ...
2025-06-20统计学模型:解锁数据背后的规律与奥秘 在数据驱动决策的时代,统计学模型作为挖掘数据价值的核心工具,发挥着至关重要的作 ...
2025-06-20Logic 模型特征与选择应用:构建项目规划与评估的逻辑框架 在项目管理、政策制定以及社会服务等领域,Logic 模型(逻辑模型 ...
2025-06-19SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的利器 在数据分析的众多方法中,Mann-Kendall(MK)检验凭借其对数据分 ...
2025-06-19CDA 数据分析能力与 AI 的一体化发展关系:重塑数据驱动未来 在数字化浪潮奔涌的当下,数据已然成为企业乃至整个社会发展进 ...
2025-06-19CDA 干货分享:统计学的应用 在数据驱动业务发展的时代浪潮中,统计学作为数据分析的核心基石,发挥着无可替代的关键作用。 ...
2025-06-18CDA 精益业务数据分析:解锁企业增长新密码 在数字化浪潮席卷全球的当下,数据已然成为企业最具价值的资产之一。如何精准地 ...
2025-06-18