京公网安备 11010802034615号
经营许可证编号:京B2-20210330
基于你的点赞轨迹,数据挖掘可以探知你的性格秘密
整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和可能。例如,基于脸书的挖掘,可以探知你的智商、神经质、生活满意度、宗教信仰、单身与否、身材发福、产后郁郁、话题偏好和舆情监测等。
美国科学院院报(PNAS)最近的一篇研究表明,在社交网站上别轻易点赞,因为点赞能够泄露你一些比较私密的性格特质。基于社交网站上(例如 Facebook)的点赞,可以计算出你的性格特征(大五人格The Big Five),通过算法计算的结果比你的朋友、同学、亲人判断的更准。
研究过程。具体的做法就是,作者邀请脸书上8.6万志愿者参与一项性格测试,并且收集了他们的“点赞”数据(即对什么帖子或内容发生点赞行为)。并 且邀请了被试的亲朋好友参与测试,给出有关该被试性格的评价。这样就有关于被试的三份性格数据,一份是自我的评价,一份是亲朋好友的评价,一份是基于点赞 数据计算的结果。研究结果表明,算法得到的性格倾向指数比亲朋好的判断更为准确。
点赞和特质。点赞的时候,我们希望向脸书好友展示我们对特定内容(包括状态更新、照片、书籍、产品、音乐)的积极态度。但是,与此同时,“点赞”行 为也暴露了你很多的私密信息、敏感特质、性格偏好和行为倾向等。例如宗教信仰、政治观点、性取向和酒量等。而且,通常一个点赞(例如点赞了某一篇分享)就 能够产生较为精准的预测。一些结论举例如下。
具体的,大概只需要10个“赞”,计算机就能比同事更准确的判断你的性格。通过70个“赞”,电脑就能超过其朋友。140个“赞”便超过其家人(父母亲兄妹)。300个“赞”则能“击败”你的伴侣。
状态更新和单身判断。发现颜高妹子的时候,小伙伴们冒出的第一个念头,她是不是单身哈。告诉你一个福音,脸书帮你解决这个问题了。
脸书通过上百万的状态更新的数据,基于更新内容进行文本分析,识别一些特征变量,从而判断和预测用户何时从单身状态变成恋爱中状态。进一步地,脸书 联合企业将研究结论进行商业应用,即向个人页面首页投放相关的产品广告。例如,向恋爱中的用户提供产品(买一赠一、情侣折扣等),或者向失恋的用户提供产 品(纸巾、Ben&Jerry的冰激凌等)。
朋友圈,你常常会收藏一些内容和文档。其实,通过你的收藏,也是可以判断你高度敏感的个人特征的。例如性取向、生活满意度、智力、情感稳定性、宗教信仰、过度饮酒习惯、年龄、性别、种族、政治观点等。
脸书上每个人都需要上传自己的头像。基于用户的头像,脸书可以做什么事情呢?人脸识别技术。
人脸识别是指,基于面部特征,分析五官的相对位置、尺寸、形状等,保存最为突出的特点,将图像数据转化为矩阵数据,以便面部识别。
对用户的头像进行人脸识别后,脸书会检索整个互联网,看看这些照片还在哪里出现过,看看是否出现在别人的合影中,猜测你可能会认识哪些人,从而向你推荐一些二度三度的朋友。
另外一方面,脸书也会将照片与公司网站、在线相亲网站进行匹配,或者从最新发表的博客或文章中寻找有关你的更多的信息。从而了解你的职业、兴趣、偏好和行为倾向等。
谷歌眼镜和社交媒体。之前看过一个视频,描绘的就是一个小伙伴带上谷歌眼镜后,遇到一个陌生人,迅速通过谷歌眼镜找到很多有关这个陌生人的信息。想在想一想,这也是可以实现的。
谷歌眼镜需求和脸书的合作。谷歌自己开发了一套Nametag技术。基于该技术,当遇到陌生人时,谷歌眼镜通过拍照,把人脸上传,丢到脸书上进行人脸识别。从而匹配到该陌生人的职业、年龄、生日、动态、朋友圈、日志、状态和最近的兴趣等。
现在有些公司,借助社交媒体内容,进行潜在员工的筛选。招聘方通过个人资料,例如脸书,抓取脸书上的个人信息,基于信息和网络环境中个体表现出来的特质,判断和预测个体的智力水平和情绪稳定性。从而作为员工录用的一个参考的标准。
头像变化分析。在脸书上,每个人的头像都不会一成不变的,间隔一段时间,大家就会采用新的头像或自拍照。你在进行头像更新时,脸书就在思考另外一件事,即他们通过人脸识别技术,判断前后头像是否存在差别,即你是否变胖了。
如果图像分析的结果表明,你确实发福了,恰好你的性别又是女性的话,脸书很可能就会联合一些减肥、健身、保健公司,向你的个人页面,精准的推送一些折扣券。
越来越多的公司关心员工的福祉,关心员工的生活状态,并且及时的进行涉入和干预,以便你快乐工作和快乐生活。
一家公司就通过分析女性员工社交媒体上的发帖和话题(例如微博、脸书、Twitter)来判断她们是否存在陷入产后抑郁症的风险。通过抓取女性员工在生产前后几周在社交媒体上的话题和发言,摘取其所使用的动词。
分析结果表明,有抑郁症倾向的母亲常常会使用暗示“焦虑”和“不高兴”的话。发言中一般会包含一些贬义词,例如“失望”、“痛苦”、“讨厌”等,暗示着失望情绪的疯长。
2013年台风席卷菲律宾时,通过社交媒体脸书上PO的照片数据,人们绘制一幅救灾线路图。
发生灾难时,人们常常会将自己亲身经历的照片、文本、视频发布到社交媒体上。研究者们对人们上传的照片进行分析和挖掘。对于一张受灾照片,“损害程 度如何?通过点击按钮确定,无、中度、严重”。对于Facebook或Twitter文本信息,判断文本的类型即“寻求帮助”、“基础设施损坏”、“人口 流失”、“相关但属于其他”等分类。
然后通过确认数据来自菲律宾的哪个地方,通过照片或文本发送时携带的GPS传感信息来定位,从而绘制一个受灾地图。
通过这个救灾地图,就可以得知,谁需要什么、谁需要食物、尸体在哪里、哪里有流离失所的人、哪里受到的灾难较为严重、什么医院损伤最小。从而为救灾提供了最一手、最新鲜的信息。
很多公司目前都跟在踪和监测社交媒体上与品牌相关的词汇(产品、品牌、竞争者、品牌代言人、政策趋势等),并进行情感和话题分析,了解人们在网络上如何讨论公司及其产品。
社交媒体也是一个早期的预警系统。当消费者对产品或服务不太满意时,他们会在社交媒体上吐槽,企业迅速捕捉此类信息,并且进行产品服务改良,控制负面消息的扩散和传播。
通过社交媒体的这些案例,想要表达什么呢?大概几点。
第一,不管你有没有意识,你的很多行为都会留下数字痕迹。文本(微博)、视频(优酷土豆等)、音频(客服电话)、图片(朋友圈)、传感器数据(手环、手机内置的传感器)等。
第二,别否认,机器和算法有时候更懂你。
第三,算法是理性的,智能是性感的。并且,算法和智能是相伴而生的。
第四,延伸来说,基于数据挖掘,计算机是能够推断出你我的心理特质的。更进一步,如果计算机能根据个人性格特质做出匹配性的响应,那么它就真的成为具有情感和社交能力的智能产物了。
不知道大家是否看过电影《她Her》、《机械姬Ex Machina》(注:年度科幻电影排名前五),《她》里面基于人工智能虚拟的Dream Girl,绝对是你完美的伴侣。
第五,最后一点也是最为重要的一点,好歹我也辛辛苦苦梳理了这么多的资料,看完记得点赞哈。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21