京公网安备 11010802034615号
经营许可证编号:京B2-20210330
微博泄露你的性格 数据分析让你无处藏身
每年全球企业在直销上的投入力度都在万亿级别以上——无论是消费者收到的广告电子邮件还是各种实体宣传资料(仅美国去年的投入资金就是1700亿美刀)。但在这些被动接收广告的人群中,只有3%的人最终有了任何的购买行动。
如果这些广告资料是电子形式的,那么最终浏览率只有0.1%,而线上广告的交易转化率只有可怜的0.01%。也就是老美每年的1650亿美刀都用来骚扰民众,制造垃圾了。
这在当下这个标榜浏览分析,隐私难以遁形的时代,着实让人意外了一把。营销部门们拿着数以T计的潜在客户数据,又重金买来软件分析民众购买习惯;之后又马不停蹄调整各种营销策略吸引眼球。最后就搞成了个这?
“因为他们都错了。”Eben Haber,IBM加州Almaden研究中心的一位资深研究员是这么说的。他表示根本的问题在于现下的公司都试图通过客户的人口统计学资料(比如年龄、性别、居住地...)来了解他们。他认为真正关键的其实是这背后“深度的心理学档案”——包括客户的性格、价值观和需求。
现代心理学将人的性格划分为5个维度:外向性,亲和性,责任心,神经质和开放性。过去的研究表明人们在这些特性上的得分确实能够预测他们的购买行为。外向性格者更容易被一部突出“活力”的手机吸引,而不是“方便”或者“私密性”;相比之下,他们更喜欢可口可乐而不是百事。但亲和性格者反过来会倾向于百事。
当然,消费者肯定不会傻到给市场部门的工作人员们填写性格问卷,难道还嫌接到的骚扰电话不够多吗?但是Haber和他的团队已经开发了一款软件——从twitter上抓取微博中的字段来分析博主的性格,价值观和需求。
这款性格分析软件是基于Colorado Boulder大学2011的一项研究。他们招募了一批博主并对其博文中的字词频率进行分析,发现特定的用语习惯跟性格相关。
其中一部分相关性是显而易见的:比如“酒吧、餐馆、人群”跟外向型者密切相关;神经质型者则喜欢用“慵懒、可恶、桑心”这样的字眼。但是,也有一部分搭配让人无法捉摸,比如“信任”(亲和型者常用)跟“夏天”经常会一起出现;还有“配合”(也是亲和型者常用)跟“异常”配对。
而之后Haber和他的团队在这项研究的基础上开展了自己的探索,最后发现还有两类不与性格直接相关的用词划分为其他两个维度:价值观和需求。
在系统的测试阶段,Haber分析了3个月中9千万用户的微博数据——50条微博就足以让他们的软件获得不错的性格解析结果,如果有200条,那结果会非常准确。
目前这一系统正在一家金融服务公司的测试之中。如果一切顺利,Haber希望年底能够发布。他表示新软件将消费者看做一个个独立的个体而不是“一堆人口统计学数据”,但是这样做的代价是否意味着陌生人能轻易掌握你的心理学档案?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15