
带着一颗敬畏之心,站在大数据时代的中央
当下中国,大数据是个热词。今天的企业、政府,乃至整个社会,很容易通过大数据对市场一目了然,但一目了然之后怎么做?漠视它、改正它、还是适应它?大数据是怎样发挥价值的?
以腾讯近日发布的大数据微报告《95后迷之隐私观大揭秘》为例,走进那些让数据“活”起来的人,或许能找到答案。
大数据给不出解释
一份数据背后,不仅是坐在电脑前,对着数字表格,还会奔波在见调研对象的路上。“大数据给出了结论,但给不了解释。”腾讯用户与市场研究中心总监谭池如是说。
他举了一个多年前参与的手机调研项目为例,通过大数据老外们惊讶地发现中国人偏爱某一种输入法,可是想不通为什么?经过传统调研了解到,由于中国人的抽烟习惯,是一只手拿烟时另一只手只好单手打字,所以用户会偏爱单手型输入法。所以,当这个“为什么”被了解以后,产品的开发才能更多考虑相关模式。
谭池说,“为什么”往往就是大数据的盲点,想要找到答案,还是要依靠面对面的交流询问。就这样,人与人交流的传统模式,不仅没有被掩埋,反而在大数据时代,被一个个数据又激发出来。
大数据读不出场景
大数据提供了一个结果,但它并不知道用户在使用产品时,身处什么样的场景,怀揣怎样的心情,有着怎样的需求,唯有人与人面对面,才能知晓。
腾讯研究员朱丹招募6位盲人为一个无障碍功能设计做访谈准备时,她完全没有想到这群盲人不仅会使用智能手机,而且相当熟练。他们的手机中不断发出“滴”“滴”短促的电子音,常人的耳朵根本听不懂是什么,他们却熟练地使用互联网产品。真切地接触才看得到,原来网络对他们的帮助比我们想象中大很多。
用户真正的使用情景,他们的担忧、开心、困惑与不爽,目前的大数据读不出来。数据再大也是死的,只有人能激活它。
大数据不知道怎么做
大数据本身,并不能给出一个既定做法。面对数据运算的结果,之后的步骤可能更加重要。
研究员韩娜举了一个关于“签到”的例子,究竟95后用户更喜欢哪一种呢?产品经理可能先去找数据师,去调相关的大数据。大数据显示,95后更热衷于每天上网“签到”。但是他们“签到”究竟是出于什么心理,获得了什么满足,数据并不懂。
于是,产品经理接着找韩娜,请她进行用户研究。结果显示,95后乐意“签到”,更多是为了满足自己的情感需求,尤其是“刷存在感”。
时间久了,韩娜渐渐明白,自己做完调研,不能仅仅解答“为什么”,“用户怎么想”,还要给出“怎么做”的建议。
大数据未必懂得价值
罗英、何文是“数据挖掘师”。但这份工作想做得好,单纯依靠算数据并不够,其实还要动用“情商”。
他们举了个例子,QQ音乐有一个功能叫“猜你喜欢”,基于大数据平台。首当其冲的是准确率,能猜对多少首歌?不同的数据师,可能会设计不同的算法,有的人效果比较好,他把“年龄”的数据用起来,而另外一个人没用,就会导致两者准确率有差距。为什么有人能想到“年龄”,而有人却想不到?凭借的更多是对业务的理解。或者说,考验的正是数据师对人性的洞察。
“在我们行内有一个不等式:业务知识>数据>算法。”罗英解释,“而业务知识就是你的理解能力。”用同行的话来说,就是“你的架构是否合理。”
“大数据就好像是一杯水,我们需要去厨房煮菜,水只是素材之一。我们不能直接把水卖给客户,我们需要煮好一碗菜,才能端给客户。”罗英形容。
大数据还能做什么
已经活跃了11年的社交平台QQ空间有着丰富的用户数据,最近腾讯运用这些数据为个人生成一份“社交回顾互动”H5,比如显现出你第一次注册空间的时间,跳出第一张上传的家人合照。“其实也捏了一把汗,这对图片的数据解读要求非常高。”从事QQ空间运营已经11年的琪琪说,“试想,第一张与家人的合影,万一大数据判断错误,跳出来的照片是与男同事的合影,岂不是很尴尬?”怎么抽取数据,让数据判断准确很重要。琪琪认为,利用大数据,我们可以策划许多活动,活动还能变化出各种“玩法”,人的想象力是无穷的。
研究员小迪,做调研时遇到一名初中男孩,对方很有倾诉欲。男孩告诉他,自己有5个QQ号,4个已经被妈妈“破解”了,可能是因为密码太简单,都是生日之类,妈妈太容易猜到。于是他想出了第5个QQ密码,复杂到连自己也记不住。他把密码放在带锁的储钱罐里,每次用这个账号登陆QQ时,他都要先从床底下把密码翻出来才行。
这个故事,后来被小迪写进了《95后谜之隐私观大揭秘》报告中。该报告揭示,95后是一群非常注重隐私的群体,近四成95后认为,自己的隐私遭到过侵犯,他们为了保护隐私采取过各种小手段,他们渴望有自己的空间,活跃于QQ空间其中一个原因就是可以不和父母在同一个社交圈。
我们已经迈入一个大数据的时代。有人说,终究有一天,数据的价值将超过土地的价值。但是也有人说,世界就是一个“黑盒子”,永远无法窥探内部的秘密。
(文中的人名均为化名)
人无法被替代
对话
解放周一:那么您对大数据的未来怎么看?有了人工智能、深度学习,未来人还有用武之地吗?
李航(腾讯集团市场与公关部总经理):目前看待和处理大数据有几种方式。一类是对年龄、性别、星座等基础结构型数据进行呈现和总结。第二类是视频数据、语音数据、图像数据,我们有像优图这样世界领先的技术团队,他们在音频、人脸、图片识别等领域都有深入研究,这也是腾讯的技术优势所在。现在我们正在研究,如何让语音数据与图像数据结合进行分析。第三类就是人工智能,它的想象空间非常大,或许通过深度学习,未来人工智能自己会对数据产生洞察力,理解数据背后的意义、原因、提供建议,一切皆有可能。
未来也许人机之间有新的协作模式,但我相信人无法被替代。人性很复杂,即使人与人的当面交流,所知也是有限的。人的情感、动机、心理,这些都是目前机器解读不了的。
越是与大数据打交道,我越是对人性保有敬畏之心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29