京公网安备 11010802034615号
经营许可证编号:京B2-20210330
有了爱情大数据,你再不会选错人
那爱情跟大数据是什么关系?我今天要讲的是从另外一个视角来看爱情。我的观念是爱情如同其他的一些感情上的行为一样,可以被数字化、数据化、数学化。
爱情和大数据走到一起了,意味着我们能以更多的智能,通过数学的方法,用现在所能得到的数据,以及大量使用的数字媒体来真正得到对爱情的洞察。
这里面的关键词是选择、匹配、预测。
就像我们很多行为可以在线上进行,约会也可以,这就叫在线约会。在线,意味着约会这个体验不再是不被记录的行为,而是被数字化了。
只要上了网,你每个点击、每个浏览、每一次打开网站,你就被记录了,数字化很自然地成为事实。
在数字化的过程中产生了数据,数据是有目的的数字组合,使得我们知道发生了什么事、有什么统计上的行为或者规律可以遵循。
美国差不多有四千多万人在线约会、找朋友、找情人、找今后长期的伴侣。
每一次他们做在线约会浏览时,大约耗时22分钟,一个星期内耗时12个小时,这是平均数。美国每十个人当中有一个人,曾经使用过类似的网站或者移动APP做在线约会规划。
66%的人通过在线软件的应用以后,他们又往前走了一步——确实去约会了,这个约会是真正现实中的行为,不是一个数字行为。
其中又有23%是真正地通过这些应用,找到了自己的配偶或者是长期的伴侣。
但另一方面,它也出现了一些以前没有的问题——信息的可靠性。56%的用户感觉到在网上的个人介绍往往是被夸大的,很大程度上误导了事实,造成了很大的麻烦。
81%的用户说自己曾经在某一项的描述当中撒了谎,其中包括谎报自己的体重,女性尤其爱往低评估;48%谎报了身高,男性在这方面尤其突出;19%谎报年纪,可能男性女性大约相同。
这些问题引起我的深思,这样一个平台上,好像数字、数据都很方便了,但是不是真正为我们服务了呢?如果没有这么多假的信息,利用拥有几千万的网络用户的软件,我们的恋爱、约会是不是能够效率更高一点?
有一个女记者Amy Webb,她也是一个未来学家,她喜欢想象未来是怎么回事。她做了一个尝试,在一个专门给犹太族裔的人群找配偶的网站上试验在线约会。
她在上面反复试验了很多次,但发布常规的信息比如说很懂日文、自己做了几年的记者等,却在找对象方面遇到很多挫折。
Amy就想,既然网站上有这么多数据,我为什么不能做一个数据分析呢?所以她做了两件事。
第一,她重点考虑了她所关心的男性对象的属性。每一次网站说,你可以跟这些人去约会,她就看一下这些人的属性是不是符合她的要求。
符合的她加一分,不符合的减一分。通过这种比较初级的方式,筛掉了很多本来网站推荐她去见一面的人。
第二,她意识到能找到心目中理想的人,并不是意味着那个理想的人也会看中她,这里面有很多竞争——她看中的这个男性,也可能会被很多的女生看中,她们会怎么接近他?
所以她用自己的模型,建立了一个分数,通过这个分数产生了十个假设的男性。
这些男性会留意到什么样的女性,会怎样和她联系约会。通过这些假设,她开始知道在介绍自己的时候,应当注重哪些方面,用什么样的语言能够成功引起注意。
这十个男性可能实际上不存在,但她至少用计分的方法算出,如果能找到类似男性的话,对她相当合适。
果然按照上述方法尝试几次后,她找到了自己最爱的一个男人,然后马上就组成了家庭,有了孩子。
这说明了什么问题?
从恋爱没有经过数字媒体,到有了数字媒体产生了数据,再到通过Amy的尝试,大家可以看到:数据可以帮助你把感情的事情理性化,从数字里看到一些自己可努力的方向,大量减少自己要搜寻的工作,使得爱情在有限时间、有限资源的情况下得到最好实现。
说到资源、选择、匹配,它能让一般的爱情有更多更广泛的内涵。
第一、 爱情可以被数字化、数据化,今天我们还可以把它数学化。
第二、 爱情大数据的作用已经被意识到了,大家都在开展这方面的应用。
应用到什么程度了呢?因为今天有很好的传感器、很多的摄影机、造像、信息处理、图象处理技术,一个男性说,我要找有范冰冰脸的女性,那他就可以发现很多有类似容貌的女性,而不是像以前那样,只能用模糊的数据描述这是女的、现在多大年纪。
第三、 爱情本身是一个选择匹配和预测的人类行为。
这种行为不止于谈情说爱,还能用在比如招聘、求学等选择领域,公司在找你,你也在找公司;你要选一个适合自己的最好大学,大学也在选你……
双向选择的过程几乎到处都有,我们对爱情大数据的研究,也不会仅限于对爱情的研究,对所有这些双向现象都要研究。
我的创业公司正在把基本的数字、数据和数学能力糅合,形成有力的产品,帮助大家对爱情产生更多深刻的认识,也是从数据能力上解答一个几千年、几万年的人类婚恋难题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15