京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用大数据来判定你的人品
电脑的作用可不仅仅是让你解决复杂的数学问题和播放萌猫视频,随着计算机技术的发展,它将能够判别出我们的为人,也许我们要为此感到庆幸。
一家名为 Upstart 的公司在过去的 15 个月中已经向那些几乎没有信用评级的人们借出了 1.35 亿美元。这些人大多是刚刚毕业的大学生,他们没有可抵押的资产、汽车,也没有相关的信用卡记录。
通常贷款机构会用上述指标来为一个人进行信用评级,以此判定他们是否能够获得贷款资格。然而这些年轻人刚刚踏入职场,还没有为自己建立起这一套用于判定信用等级的依据。因此 Upstart 转而参考了这些人的 SAT 得分、学校背景、所学专业以及在校平均成绩。这家公司需要参考的指标与公司对于录取新员工所做的背景调查差不多,除此之外他还会评估申请者的人格特质。
「如果两个人拥有同样的工作和同样的生活背景,比如都已经有孩子,相比之下那个在校时取得了更高 GPA 得分的人更有可能在五年之后还款。」Upstart 的联合创始人与产品主管 Paul Gu 解释道,「这无关于你的支付能力,它谨代表了你对于履行自己的义务是否看重。」
这种判定方法已经通过数据得以验证,那些会反复检查作业以及为了应对突击测试而额外花时间学习的人更有可能履行自己的债务。
Upstart 会通过数据分析和面对面交流来判定一个人的偿债能力。「我猜你可能会将这些特质称作性格特征,但是我们并没有使用这种标签。」年仅 24 岁的 Paul 向我们解释道。
拥有看重自己所承担义务的人格特质不仅能使人进入更好的学校,取得更好的成绩,同样也会让其看重自己的债务问题。ZestFinance 的创始人 Douglas Merrill 是谷歌公司前高管,他的公司也会通过一些非标准化的数据来判定是否要给一个借款人提供贷款。
Zest 公司的一个常用指标就是该人是否曾经放弃过一个预付费的手机号码。人的居住地变化不定,在找人的时候手机号码相比居住地址更加可靠。放弃了一个常用号码可能意味着你想要(或者不得不)逃避家人与潜在雇主的联系,这对于个人信用来说是一个糟糕的信号。
Zest 最近将业务拓展到那些「次优」借款人中,这些人可能是从最优借款人分类中跌落,也可能是从次级贷款借款人目录中得以提升。Zest 公司所面临的问题就是找出这些人为什么信用评级发生了变动,并且想要从中找出那些潜在的可靠的借款人。或许他们评级发生变化只是因为运气糟糕,比如承担了一次额外的医药费支出。
「『性格』这个词内涵丰富,一个人是否拥有还款能力和是否愿意还钱之间存在着本质的区别。」Merrill 进一步说明道,「如果仅仅是看金融机构提供的流水数据,你难以看出一个人是否具有还款意愿。」
Merrill 拥有心理学博士学位(他从普林斯顿大学毕业,从这点来看 Paul 应该是想要借钱给他的),他认为数据驱动的人格特质分析相比标准化的评判指标要更加公平。
「我们总是用各种方法来评判别人,但是如果没有数据支持,我们就是依靠自己的选择性偏见来做出判断。我们的判断通常来自于自身的认识,这通常就意味着人们总是会偏爱那些与自身相似的人。」利用熟悉感来进行风险管理非常原始的方法,这种方法得出的结果有失公平。
一个人的性格特征(我们通常会选择更为中性的词来表示相同的意思)如今已经可以由许多算法来完成判定。一家名为 Workday 的公司提供基于云端的性格分析软件,该公司发布了一款包含 45 项员工绩效指标的产品,其中包括了一个人在同一职位上工作了多长时间,以及他们的工作业绩如何。该软件中的指标可以用于预测一个员工离职的可能性,并且还能对于如何留住这类员工提供合适的参考建议,比如是给他换个新工作还是进行岗位调整。该产品还能够判断出主管经理是否具有留住人才能力,并且将其分为「人才大师」和「人才终结者」。
在 Workday 公司内部他们会使用该软件产品分析自己的销售队伍,并试图找出一个成功销售员的决定因素,结果发现造就成功销售员的首要品质就是坚韧不拔。
「在决定是否要雇佣某人或者晋升某人时,我们都会有着自己的偏见。」Workday 公司技术策略主管 Dan Beck 如此解释道,「如果你能够使用客观的数据去纠正这种存有偏见的判断,自然是极好的。」
Dan Beck 认为人们研究这些性格特征将会鼓励自身向这些好的品质看齐,因为「如果你知道一种指向成功的模式,那么为什么你自己不接受这种模式呢?」
从某种意义上来看,从数据中研究成功者的性格与行为特征与看名人传记寻找其成功的线索没有什么区别。只不过数据研究这种方式其范围要广得多,因为它的基础建立在观察每一个人的行为方式之上,而不像名人传记仅仅从个案研究入手。
我们有理由相信基于数据分析的性格特质判断会更加可靠。斯坦福大学计算机科学教授 Jure Leskovec 完成了一项对比研究,其内容是将数据分析的预测结果和与法官保释听证会的结果作比较。在保释听证会中法官们只有短短几分钟去评判一个囚犯是否应该获得保释,其结果是否会存在着危害社会的风险。据 Jure Leskovec 介绍,研究早期结果显示,依据数据分析的预测结果在预防犯罪上相比依靠法官个人经验判断获得了 30% 的提升。
「算法是客观的,偏见来源于人心。」Leskovec对其研究进行了总结。
然而这同时道出了很真实且重要的一点:任何算法都不是从天而降的。算法是由人写出来的,即使通过算法得出的结果并无偏见,但是在设计算法的过程中可能偏见已经存在其中,我们最终可能会接受一种有缺陷的信念即数学计算得出结果的永远符合事实。
Upstart 公司的创始人 Paul 表示他拥有完美的 SAT 得分,但是却从耶鲁辍学了,如果按照他自己最初设计的算法,连他本人也无法从 Upstart 公司获取贷款资格。据此他改变了对于算法的设计,因为他意识到了在今后工作中所承担的责任。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05