
有了爱情大数据,你再不会选错人
那爱情跟大数据是什么关系?我今天要讲的是从另外一个视角来看爱情。我的观念是爱情如同其他的一些感情上的行为一样,可以被数字化、数据化、数学化。
爱情和大数据走到一起了,意味着我们能以更多的智能,通过数学的方法,用现在所能得到的数据,以及大量使用的数字媒体来真正得到对爱情的洞察。
这里面的关键词是选择、匹配、预测。
就像我们很多行为可以在线上进行,约会也可以,这就叫在线约会。在线,意味着约会这个体验不再是不被记录的行为,而是被数字化了。
只要上了网,你每个点击、每个浏览、每一次打开网站,你就被记录了,数字化很自然地成为事实。
在数字化的过程中产生了数据,数据是有目的的数字组合,使得我们知道发生了什么事、有什么统计上的行为或者规律可以遵循。
美国差不多有四千多万人在线约会、找朋友、找情人、找今后长期的伴侣。
每一次他们做在线约会浏览时,大约耗时22分钟,一个星期内耗时12个小时,这是平均数。美国每十个人当中有一个人,曾经使用过类似的网站或者移动APP做在线约会规划。
66%的人通过在线软件的应用以后,他们又往前走了一步——确实去约会了,这个约会是真正现实中的行为,不是一个数字行为。
其中又有23%是真正地通过这些应用,找到了自己的配偶或者是长期的伴侣。
但另一方面,它也出现了一些以前没有的问题——信息的可靠性。56%的用户感觉到在网上的个人介绍往往是被夸大的,很大程度上误导了事实,造成了很大的麻烦。
81%的用户说自己曾经在某一项的描述当中撒了谎,其中包括谎报自己的体重,女性尤其爱往低评估;48%谎报了身高,男性在这方面尤其突出;19%谎报年纪,可能男性女性大约相同。
这些问题引起我的深思,这样一个平台上,好像数字、数据都很方便了,但是不是真正为我们服务了呢?如果没有这么多假的信息,利用拥有几千万的网络用户的软件,我们的恋爱、约会是不是能够效率更高一点?
有一个女记者Amy Webb,她也是一个未来学家,她喜欢想象未来是怎么回事。她做了一个尝试,在一个专门给犹太族裔的人群找配偶的网站上试验在线约会。
她在上面反复试验了很多次,但发布常规的信息比如说很懂日文、自己做了几年的记者等,却在找对象方面遇到很多挫折。
Amy就想,既然网站上有这么多数据,我为什么不能做一个数据分析呢?所以她做了两件事。
第一,她重点考虑了她所关心的男性对象的属性。每一次网站说,你可以跟这些人去约会,她就看一下这些人的属性是不是符合她的要求。
符合的她加一分,不符合的减一分。通过这种比较初级的方式,筛掉了很多本来网站推荐她去见一面的人。
第二,她意识到能找到心目中理想的人,并不是意味着那个理想的人也会看中她,这里面有很多竞争——她看中的这个男性,也可能会被很多的女生看中,她们会怎么接近他?
所以她用自己的模型,建立了一个分数,通过这个分数产生了十个假设的男性。
这些男性会留意到什么样的女性,会怎样和她联系约会。通过这些假设,她开始知道在介绍自己的时候,应当注重哪些方面,用什么样的语言能够成功引起注意。
这十个男性可能实际上不存在,但她至少用计分的方法算出,如果能找到类似男性的话,对她相当合适。
果然按照上述方法尝试几次后,她找到了自己最爱的一个男人,然后马上就组成了家庭,有了孩子。
这说明了什么问题?
从恋爱没有经过数字媒体,到有了数字媒体产生了数据,再到通过Amy的尝试,大家可以看到:数据可以帮助你把感情的事情理性化,从数字里看到一些自己可努力的方向,大量减少自己要搜寻的工作,使得爱情在有限时间、有限资源的情况下得到最好实现。
说到资源、选择、匹配,它能让一般的爱情有更多更广泛的内涵。
第一、 爱情可以被数字化、数据化,今天我们还可以把它数学化。
第二、 爱情大数据的作用已经被意识到了,大家都在开展这方面的应用。
应用到什么程度了呢?因为今天有很好的传感器、很多的摄影机、造像、信息处理、图象处理技术,一个男性说,我要找有范冰冰脸的女性,那他就可以发现很多有类似容貌的女性,而不是像以前那样,只能用模糊的数据描述这是女的、现在多大年纪。
第三、 爱情本身是一个选择匹配和预测的人类行为。
这种行为不止于谈情说爱,还能用在比如招聘、求学等选择领域,公司在找你,你也在找公司;你要选一个适合自己的最好大学,大学也在选你……
双向选择的过程几乎到处都有,我们对爱情大数据的研究,也不会仅限于对爱情的研究,对所有这些双向现象都要研究。
我的创业公司正在把基本的数字、数据和数学能力糅合,形成有力的产品,帮助大家对爱情产生更多深刻的认识,也是从数据能力上解答一个几千年、几万年的人类婚恋难题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29