京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据:网络时代的科学读心术_数据分析师
人的心思之所以难以捉摸和认识,是因为人的主体性问题。凡是正常的人,都有独立自主性,思想可以不受外界的影响。正因如此,人的思想世界是一个极其复杂的世界,神秘多变、复杂多样。为了读懂他人的心思,不少学科和诸多学者作了许多努力。例如,德国学者弗洛伊德专门创立精神分析理论,试图通过梦的解析来读懂人的所思所想。现代心理学则试图引入观察、实验、问卷调查等自然科学方法来破解人们的心理,把握人类的心理活动规律,建立关于人类心理的科学体系。这些研究揭示出人类心理的一些共同规律,为科学读心术作出了重要贡献。然而,由于信息的不对称性,心理学、社会学等学科无法全面揭示人类的思想和行为规律,而大数据技术的兴起为揭开人类心灵面纱提供了一种全新的科学工具,从而成为网络时代的科学读心术。
大数据使读懂他人心思成为可能
所谓大数据(bigdata),从字面意义来说就是数量规模特别巨大的数据集合,因而用传统的方法无能为力而必须使用计算机或云计算技术才能处理。近年来,智能手机、平板电脑等移动智能终端的大量普及,各种监控系统以及物联网的形成,互联网络高度发达,云存储、云计算等云技术迅速发展,带来了数据采集的自动化、数据类型的多样化、数据传输的即时化、数据存储的云端化以及数据处理的并行化。从数据采集来说,数据来自智能设备,在无人参与的情况下,海量数据就不知不觉地从智能终端中自动产生出来。这种由智能系统采集的数据由于不被人为干扰,因而反映了人们思想、行为的真实状态,具有与主体无关的客观真实性。从数据类型来说,智能系统采集的数据基本上都是离散数据,能够及时被电脑等智能设备处理,而且类型特别丰富,包括文本、图片、音频、视频等,全面刻画了数据采集对象的各种状态。从数据传输来说,智能终端采集的数据被即时传输上网,实现了在线采集和传输。从数据存储来说,云存储具有海量的空间,采集数据的智能终端不再需要巨大的存储能力。而面对海量的各类数据,并行的云计算能够在不同的地方同时进行计算和处理,再多的数据在云计算面前都不在话下。
在大数据时代,我们每个人都不知不觉地成了自动且免费的数据提供者,自动暴露了自己的一切言行。我们每天浏览网页,阅读新闻,发表评论;我们偶尔也上网购物,漫步在淘宝的虚拟店铺,在亚马逊、当当的网上书店里浏览、购买图书并留下自己的评论;我们也经常在博客、微博中洋洋洒洒写下自己的所思所想和世界各地的旅游足迹,有图有字有真相;我们用QQ、微信等网络交流工具与熟悉或陌生的所谓网友谈天说地,敞开心扉与素不相识的陌生人透露自己的喜怒哀乐;我们还每天打电话、发短信,在超市购物,溜达在装满摄像头的街道和建筑中。殊不知,这一切的一切都已被智能终端自动记录下来,并上传网络,存储云端。总之,我们的一切,包括所思、所想、所为,都留下了数据化足迹。如果说物理足迹会随岁月流逝而消失的话,那么这条数据化的足迹却永远难以抹去,成了一条永不消逝的信息链。大数据时代,一切心思都已经摆在网络上,透明而清晰。通过大数据,不懂心理学的普通人,可以轻松读懂他人的心思。
大数据或能读懂过去、
预测未来
大数据为什么能够读懂人的心思,又是怎样读懂人的心思?关键就是它解决了人类心理信息的不对称问题。对于复杂的心理活动来说,传统的数据收集方法太落后,人工收集的数据难于解决信息失真问题,而且所收集的少量数据根本不足以全面刻画人的复杂心理,因此研究者与研究对象处于完全的信息不对称状态,人类心理当然就显得神秘莫测。大数据属于自动收集数据,随时随地记录下人们的一切,这海量的数据反映了我们所有的言行举止,暴露了我们的一切行踪,研究者只要挖掘这些数据就能掌握我们过去的一切信息。通过数据挖掘,不但可以刻画人们过去的心理、行为轨迹,而且还可以找到数据间的相关性,找到其中具有规律性的东西。根据数据足迹及其相关性规律,他人不用复杂的猜测过程就能用数据手段科学地刻画和把握人们的内心世界。更有甚者,大数据不但能读懂人们的过去,或许还能预测未来。我们知道,人类的思想和行为都具有路径依赖性,根据以往数据的相关性,能够找到人们过去的思想行为规律。根据这些规律,他(她)未来一定时间内会想什么、会做什么就有可能预先被推测出来。对那些有犯罪企图的人,如果我们能提前预测就能防患于未然。当然,对一般人来说,能够预知他人的心思可能也很有意义,否则怎么会有那么多人猜测他人心思呢?例如恋爱中人就特别想知道自己恋人的所思所想,以便做好应对之策。
大数据比人们自己还更了解自己。在大数据面前,人们以往的假面具和伪装术都失去了效用和意义。不过这也带来了诸多的伦理问题。例如信息安全、隐私保护和个人自由就是几个突出的问题。我们每天使用电脑和手机,每天暴露在监控之下,这些智能设备产生的数据究竟产权归属于谁?我们自己是否有知情权、使用权和删除权?我们的所有隐私都暴露在网络中,随时可以被他人挖掘和利用,我们每个人在大数据面前都变成了透明人。因此,在大数据时代,我们的隐私权该怎么来保护?大数据能够挖掘我们的过去,预测我们的未来,那我们的思想和行为自由会不会受到监视和控制?我们是否还有自己的思想和行为的自由?这些问题都值得我们认真去思考和解决。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01