京公网安备 11010802034615号
经营许可证编号:京B2-20210330
有了爱情大数据,你再不会选错人
那爱情跟大数据是什么关系?我今天要讲的是从另外一个视角来看爱情。我的观念是爱情如同其他的一些感情上的行为一样,可以被数字化、数据化、数学化。
爱情和大数据走到一起了,意味着我们能以更多的智能,通过数学的方法,用现在所能得到的数据,以及大量使用的数字媒体来真正得到对爱情的洞察。
这里面的关键词是选择、匹配、预测。
就像我们很多行为可以在线上进行,约会也可以,这就叫在线约会。在线,意味着约会这个体验不再是不被记录的行为,而是被数字化了。
只要上了网,你每个点击、每个浏览、每一次打开网站,你就被记录了,数字化很自然地成为事实。
在数字化的过程中产生了数据,数据是有目的的数字组合,使得我们知道发生了什么事、有什么统计上的行为或者规律可以遵循。
美国差不多有四千多万人在线约会、找朋友、找情人、找今后长期的伴侣。
每一次他们做在线约会浏览时,大约耗时22分钟,一个星期内耗时12个小时,这是平均数。美国每十个人当中有一个人,曾经使用过类似的网站或者移动APP做在线约会规划。
66%的人通过在线软件的应用以后,他们又往前走了一步——确实去约会了,这个约会是真正现实中的行为,不是一个数字行为。
其中又有23%是真正地通过这些应用,找到了自己的配偶或者是长期的伴侣。
但另一方面,它也出现了一些以前没有的问题——信息的可靠性。56%的用户感觉到在网上的个人介绍往往是被夸大的,很大程度上误导了事实,造成了很大的麻烦。
81%的用户说自己曾经在某一项的描述当中撒了谎,其中包括谎报自己的体重,女性尤其爱往低评估;48%谎报了身高,男性在这方面尤其突出;19%谎报年纪,可能男性女性大约相同。
这些问题引起我的深思,这样一个平台上,好像数字、数据都很方便了,但是不是真正为我们服务了呢?如果没有这么多假的信息,利用拥有几千万的网络用户的软件,我们的恋爱、约会是不是能够效率更高一点?
有一个女记者Amy Webb,她也是一个未来学家,她喜欢想象未来是怎么回事。她做了一个尝试,在一个专门给犹太族裔的人群找配偶的网站上试验在线约会。
她在上面反复试验了很多次,但发布常规的信息比如说很懂日文、自己做了几年的记者等,却在找对象方面遇到很多挫折。
Amy就想,既然网站上有这么多数据,我为什么不能做一个数据分析呢?所以她做了两件事。
第一,她重点考虑了她所关心的男性对象的属性。每一次网站说,你可以跟这些人去约会,她就看一下这些人的属性是不是符合她的要求。
符合的她加一分,不符合的减一分。通过这种比较初级的方式,筛掉了很多本来网站推荐她去见一面的人。
第二,她意识到能找到心目中理想的人,并不是意味着那个理想的人也会看中她,这里面有很多竞争——她看中的这个男性,也可能会被很多的女生看中,她们会怎么接近他?
所以她用自己的模型,建立了一个分数,通过这个分数产生了十个假设的男性。
这些男性会留意到什么样的女性,会怎样和她联系约会。通过这些假设,她开始知道在介绍自己的时候,应当注重哪些方面,用什么样的语言能够成功引起注意。
这十个男性可能实际上不存在,但她至少用计分的方法算出,如果能找到类似男性的话,对她相当合适。
果然按照上述方法尝试几次后,她找到了自己最爱的一个男人,然后马上就组成了家庭,有了孩子。
这说明了什么问题?
从恋爱没有经过数字媒体,到有了数字媒体产生了数据,再到通过Amy的尝试,大家可以看到:数据可以帮助你把感情的事情理性化,从数字里看到一些自己可努力的方向,大量减少自己要搜寻的工作,使得爱情在有限时间、有限资源的情况下得到最好实现。
说到资源、选择、匹配,它能让一般的爱情有更多更广泛的内涵。
第一、 爱情可以被数字化、数据化,今天我们还可以把它数学化。
第二、 爱情大数据的作用已经被意识到了,大家都在开展这方面的应用。
应用到什么程度了呢?因为今天有很好的传感器、很多的摄影机、造像、信息处理、图象处理技术,一个男性说,我要找有范冰冰脸的女性,那他就可以发现很多有类似容貌的女性,而不是像以前那样,只能用模糊的数据描述这是女的、现在多大年纪。
第三、 爱情本身是一个选择匹配和预测的人类行为。
这种行为不止于谈情说爱,还能用在比如招聘、求学等选择领域,公司在找你,你也在找公司;你要选一个适合自己的最好大学,大学也在选你……
双向选择的过程几乎到处都有,我们对爱情大数据的研究,也不会仅限于对爱情的研究,对所有这些双向现象都要研究。
我的创业公司正在把基本的数字、数据和数学能力糅合,形成有力的产品,帮助大家对爱情产生更多深刻的认识,也是从数据能力上解答一个几千年、几万年的人类婚恋难题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28