京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据能识别好人,但没法保证他不干坏事
最近一段时间,又有多家互联网金融企业获得融资,其中不少佼佼者的上市路径也愈加清晰。而根据移动互联网咨询机构艾媒于4月18日发布的一份调研报告,截至2014年底,中国互联网金融用户规模达4.12亿,预计2015年将增长到4.89亿。
“这个行业发展到深水区比拼的核心就是大数据和风控。”4月27日,随手科技有限公司CEO谷风在接受21世纪经济报道记者采访时表示,大数据在互联网金融的风控中发挥着关键性的作用,当然对其效果也应该辩证地看待,“大数据可以帮你找到一个好人,但没办法保证他不干坏事”。
随手科技刚刚宣布完成数千万美元的B+轮融资。
“好人”识别者
《21世纪》:背靠随手记和卡牛等产品积累的用户规模,随手科技目前已是不可小觑的互联网金融流量入口。我们注意到,从去年下半年开始,你们也进行了流量变现的尝试。目前这方面的进展如何?
谷风:随手科技的商业价值转化仅仅从两个季度之前开始,目前月成交在数十亿元人民币的规模,增长速度非常快。其中,基于记账工具随手记的理财市场自2014年9月推出,仅仅两个季度时间,月交易额增长了60倍;基于银行卡管理工具卡牛的放贷,也在今年开始接入,尽管目前的成交规模还不算大,但从放贷方反馈回来的信息来看,我们用户的含金量非常高。
如你所言,随手科技发挥流量入口价值的基础是,借助随手记和卡牛等积累起来的庞大用户规模。目前,我们的总体用户规模超过1.5亿,是后十位同类产品总和的近一倍。
我们的商业化才刚刚开始,我们也不着急,它让随手科技有了正向收入来源,更重要的是证明了我们实现商业价值的可能性。
《21世纪》:在发挥流量入口价值的过程中,随手科技与合作方是一种怎样的机制?
谷风:理财方面,目前我们主要是为货币基金提供流量,也在增加股票基金,未来也会考虑接入更多的产品,诸如私募、信托等。这方面的流程在互联网金融行业内已经比较成熟。
卡牛的贷款方面,目前我们接入的大部分是P2P,也有一些银行。从我们卡牛用户的角度来看,他们是获得贷款的一方,P2P的经营风险与他们无关。从P2P等放贷方来看,我们的用户有长期的数据,临时作假的几率比较低,他们放贷给我们用户的风险也很小。现在很多P2P的情况是钱不缺,而是缺好的投资标的,而我们的用户恰好有这方面的需求。随手科技在其中主要是赚数据和流量的钱,放贷方给我们一定比例的佣金。
在这个链条中,三方都有好处。
《21世纪》:你们的数据是怎样为放贷方所用?
谷风:放贷方可以在我这里定义指标,我们一般给出200-300个指标的值。他们给出指标,我们自己做大数据挖掘和分析,给他们最后的指标值。
《21世纪》:从目前的运营来看,怎么看这种基于大数据风控的有效性?
谷风:我们的用户不是今天早上想贷款才把数据给我,而是还没想到贷款就在我们的平台上积累数据,这种积累是一个长期的过程,作假的几率很低。这就是我们的大数据价值。它能帮助放贷方找到优质的借贷人,并且用比传统模式成本低得多的方式。我们知道,传统线下模式中,不仅要找人去扫街,有渠道费用,找到之后还要做尽职调查,进行风控管理。与之相比较,我们给出去的数据是经过清洗的精准客户,放贷方基本上做好贷后管理就行了。
当然,大数据风控的问题也要辩证地看。我的观点是:大数据可以帮你找到一个好人,但没办法让这个人不干坏事,因为有时候,有人拿到钱之后,行为模式也会跟着改变。这就要求放贷方要有一系列的手段和方法,去让借款人不去做坏事。
需要强调的是,在这个过程中,随手科技和我们的客户没什么风险,风险在P2P那边。
《21世纪》:随手科技是不是倾向于搭建一个平台?
谷风:从行业内来看,有些公司在融资后转向自营做P2P的迹象比较明显。随手科技的定位是工具和流量入口,自己不涉足P2P,而是选择做开放平台,让P2P等放贷方来接入。这一方面是出于不与合作伙伴竞争的考虑,另一方面也是基于大家分工合作。
我们认为,风控这件事还是让专业的人或公司来做比较好,他们赚风控的钱,我们赚数据和流量的钱,这样大家都挺开心的。而自己做风控,说不定什么时候一笔坏账就能让你吃不了兜着走。
P2P将现大浪淘沙
《21世纪》:你似乎比较介怀P2P行业的风险?
谷风:应该说,这是一个非常不错的行业。同时,我不认为P2P行业会倾向于集中化,未来只有三到五家,除非政策限制。就像房地产一样,万科再牛,还有很多规模相对不大的地产商也活得很好,金融行业太大了,哪怕一个小企业也有可能活得很好。
就P2P而言,这个生意赚钱的关键是风控,风控不好,经营两三年,坏账出来就比较头疼。可能第一年很开心,第二年很痛苦,第三年再不好就跑路了。
这个行业我估计至少要死个几千家吧,但最后活得很好的也可能有几百家,会有很多人成功。
正如《反脆弱》那本书中提到的那样,一种系统是脆弱的,比如瓷器、比如银行,它是硬邦邦的,如果承受力超过一定限度就会导致整个系统的崩溃,比如2008年的全球金融危机中的系统性崩溃。还有一种系统是反脆弱的,比如飞机,单架可能出事,但不影响其他的飞机,它是分散的,而且经验马上可以被其他飞机学会。
假如P2P这个行业的学习能力足够,一家倒了,其他家会马上来学习,看问题出在什么地方,从而找到生存空间。前面倒下几千家,学习了几千种死法,那么剩下的几百家可能就活下来了。
我认为做风控,单一数据源是不足够的,你数据的复合度越高,那么你风控的准确度就越高,进行风险定价的时候就越精确。
财务工具还是一片荒野
《21世纪》:这也是随手科技定位于开放平台的原因之一吧?
谷风:我个人认为,一种风控模型,适合某一个特定类型的人。但是我们的用户有很多的种类,一种风控模型总是搞不定,要找不同类型的P2P来合作。
当然,随手科技的定位是为整个互联网金融行业提供流量。因此,我们的主要任务还是做好工具,要开发各种各样的工具来满足人们记账需求。目前来看,随手记只适合一部分人,卡牛只适合一部分人,还有大量的人群我们还没有找到适合他们的财务工具。需求还远远没有得到满足。我们这次的融资主要也还是投入更多记账场景的产品研发。
尽管我认为中国财务工具市场的战斗已经没什么好打的了,上半场已经结束了,不会有太大的格局改变,但是,未来财务工具的使用场景将会越来越多,因为个人的资产类别也越来越多。
《21世纪》:你认为大概覆盖到了多大的场景?
谷风:也就10%左右。我们现在有1.5亿用户。也就是说,还有80%-90%的人需要的工具,我们还在考虑。我看到的是一片荒野,到处都是荒地,没人干,就像美国的西部大开发时的牛仔,遍地是机会,赶快跑,把地圈起来是正事。这也是目前我对变现还没有那么感兴趣的原因。
重要的是找到自己的山顶
《21世纪》:但变现还是蛮重要的。
谷风:当然,为了证明我们的商业模式,也会做一些尝试,比如贷款、理财。但那些都是水到渠成的事情,不是太难,也不是核心竞争力。
就像腾讯不会致力于成为一个游戏公司,尽管它靠游戏赚钱。它还是个社交公司,最终是靠社交网络建立这个公司的基础。
放到未来五到十年来看,我们就是个财务工具公司,只是我们赚钱是靠金融变现的手段,变现迟早都能实现,毕竟财务跟金融的关系太紧密了。
就好比爬山,你可以选择在半山腰安营扎寨,也可以选择爬到山顶上。如果你到山顶上滚石头,你会发现山腰上所有的建筑都会被你摧毁。所以重要的还是找到你自己的山顶。
从这个角度来看,我真正介怀的是中国人怎样用财务工具这件事。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06