
“去年一年,我们集中接待了多个省市金融办考察来访’。”各地金融办对大数据监测的感兴趣程度,北京市金信网银金融信息服务有限公司(以下简称“金信网银”)副总经理李崇纲自己也没料想到。
从2012年开始,金信网银承建了北京市金融局大数据监测预警非法集资平台,帮助该局从互联网上搜集信息,为打击非法集资提供线索。这是不得已而为之,因为北京市金融局打击非法集资任务重大,但是能用上的人手和资源却不多,利用技术手段监测信息可以节省不少人力。金信网银根据监测出来的数据为互联网金融平台的危险性打分,这演变成后来的“冒烟指数”。
“刚开始就是个项目,可是慢慢我们发现,有这样需求的各地金融监管机构越来越多,成了我们公司一个非常重要的业务方向。”李崇纲透露,目前金信网银服务的监管机构除北京市金融局外,还有其他多个省市金融局(办)、公安机关、中国人民银行、国务院处非办,以及刚挂牌不久的中国互联网金融协会。“还有很多地方的合作,我们还在谈,估计今年会增加不少地方。”他说。
虽然金信网银目前还是上述监管机构在这个领域的唯一供应商,但据了解,还有更多的团队试图踏入这个领域。第三方平台网贷天眼、信用评级机构大公国际都在尝试开展相关业务。
提前发现e租宝风险
“e租宝出事的半年前,其实我们已经监测出来它风险极高。”李崇纲说。金信网银在监管机构当中闻名也是由于对e租宝风险的提前预警。
从去年3月开始,金信网银开始对e租宝进行监测,从5月份开始,e租宝的“冒烟指数”就已经超出了70分。一般来说,“冒烟指数”与对应的处置分几个档次:指数达到30分以上,预警平台即采取介入、干预等手段;超过60分,相关部门要列入重点监管;超过80分的,政法机关将及时启动打击处置程序。李崇纲称,e租宝的分数达到70分时,他们就已经向监管机构提出了预警。
这些分数来源于金融机构、理财产品、P2P、私募股权等等在互联网上呈现的信息。比如通过地图数据比对公司实际经营地址与工商注册地址是否一致,通过招聘数据看公司招聘人员的素质、通过对网站访问量的监测看公司是否投入太多资金做广告营销、从已经发生的非法集资案例中寻找共同特征等。
李崇纲解释:“好多非法集资的公司,不愿意让监管机构找到他们,所以经常经营地点与注册地点不一致。我们还会看这些公司的招聘信息,一般要是招初高中学历的销售人员,而且待遇超高,甚至是同行的2—3倍,这样的公司风险就比较大。再比如,如果一个公司网站短期内访问量激增,一般都是做了大量的广告营销,这部分成本太高的话,就有经营风险。”
这些特征综合起来,可以抽象出“合规性、特征词命中、传播力、收益率和投诉率”等五个特征指数。将上述五项指数加权、整合后,所测算出的数字,即是企业“冒烟指数”,代表其所涉非法集资风险。
北京市金融局的打非监测预警平台上线已经一年多。李崇纲称,根据事后的核验,大约有60%—70%的问题平台都能够提前有所察觉。但是这个效果目前还不好表述准确,因为预警之后,还有后续的立案、处理等诸多问题需要解决,大数据目前还不能解决所有问题。
目前,该平台已经对2000多家网贷平台展开了监测。李崇纲表示,今年监测的覆盖面还会扩大。同时,金信网银的团队也在努力优化冒烟指数模型,希望为每一种类型的金融机构建立专门的监测模型,并且希望利用机器学习找到更多特征与风险间的关联关系。
竞争正在展开
这个领域的竞争看起来正在渐渐展开。
就在本月,网贷天眼利用数据监测进行互联网金融风险分析的系统也已基本成型,这个监测模型不同于金信网银。金信网银目前的一些监测指标,未必是与金融业务相关的指标,但是网贷天眼希望通过对业务指标的监测来分析风险。
对网贷平台业务数据的监测是网贷天眼的长项。网贷天眼成立于2012年3月,是P2P行业两家最大的第三方平台之一,此前一直在做网贷行业数据监测,目前接入了200多家平台的数据。
网贷天眼联合创始人兼CEO田维赢称,网贷天眼监测的业务指标包括:根据网贷平台的贷款余额来判断平台的资金流动性、网贷平台的数据异常、资产类别、市场环比等,这些指标还会结合企业信息变动监控、舆情监控和针对某些平台的重点监控。
他举例解释,比如对贷款余额的监控。贷款余额指至某一节点日期为止,借款人尚未归还放款人的贷款总额。如果一个平台的贷款余额是30亿,但它排前10名的贷款人总共的贷款余额占比过高的话,其中如果有一个人违约,平台就面临很大的风险。再比如,如果新增借款标的在短期内猛增,就有可能有问题,因为在现实中要寻找合适的借款标的是需要花时间的,如果短期内猛增,很有可能是虚构的标的。
田维赢表示,他们已经与北京市金融局接触过几次,对方对他们的模型很感兴趣,双方正在探讨合作的可能。
类似的分析方法已经在实践中被证明是有效的。之前曾报道过,资深P2P投资人羿飞目前一直在做“羿飞网贷评级”,这个榜单监测的网贷平台业务数据包括:借款标的的平均利率、月成交量、平均借款周期、月活跃投资人、人均投资额、人均借款额、交易额增长率,再综合品牌认知、风控保障、服务品质,一共十项指标,并且对这些指标进行打分排名。
羿飞说,自从采用这种分析方法之后,他只踩过一次“雷”,是因为那个网贷平台在线下有很大的业务量,他事先并不知情。由于个人精力有限,羿飞只对三四十家平台进行监测,而且监测的平台会不断更新,不断地剔除他认为不靠谱的平台,并且增加新的口碑不错的待观察的平台。他告诉记者,陆续剔除的十几家平台当中,有10家左右都倒闭了,这种分析方法帮助他成功躲开了风险。
可是有时,数据监测有些“道高一尺、魔高一丈”的感觉。P2P投资人章雨(化名)曾于2013年到2014年间在一家做数据监测的网站工作过,他发现早期网贷平台的数据是比较真实的,网贷数据监测平台出现之后,网贷平台会根据这些平台的监测维度修改数据,以掩盖自己的问题。
用大数据监测互联网金融风险的道路,才刚刚开始。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30