京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“去年一年,我们集中接待了多个省市金融办考察来访’。”各地金融办对大数据监测的感兴趣程度,北京市金信网银金融信息服务有限公司(以下简称“金信网银”)副总经理李崇纲自己也没料想到。
从2012年开始,金信网银承建了北京市金融局大数据监测预警非法集资平台,帮助该局从互联网上搜集信息,为打击非法集资提供线索。这是不得已而为之,因为北京市金融局打击非法集资任务重大,但是能用上的人手和资源却不多,利用技术手段监测信息可以节省不少人力。金信网银根据监测出来的数据为互联网金融平台的危险性打分,这演变成后来的“冒烟指数”。
“刚开始就是个项目,可是慢慢我们发现,有这样需求的各地金融监管机构越来越多,成了我们公司一个非常重要的业务方向。”李崇纲透露,目前金信网银服务的监管机构除北京市金融局外,还有其他多个省市金融局(办)、公安机关、中国人民银行、国务院处非办,以及刚挂牌不久的中国互联网金融协会。“还有很多地方的合作,我们还在谈,估计今年会增加不少地方。”他说。
虽然金信网银目前还是上述监管机构在这个领域的唯一供应商,但据了解,还有更多的团队试图踏入这个领域。第三方平台网贷天眼、信用评级机构大公国际都在尝试开展相关业务。
提前发现e租宝风险
“e租宝出事的半年前,其实我们已经监测出来它风险极高。”李崇纲说。金信网银在监管机构当中闻名也是由于对e租宝风险的提前预警。
从去年3月开始,金信网银开始对e租宝进行监测,从5月份开始,e租宝的“冒烟指数”就已经超出了70分。一般来说,“冒烟指数”与对应的处置分几个档次:指数达到30分以上,预警平台即采取介入、干预等手段;超过60分,相关部门要列入重点监管;超过80分的,政法机关将及时启动打击处置程序。李崇纲称,e租宝的分数达到70分时,他们就已经向监管机构提出了预警。
这些分数来源于金融机构、理财产品、P2P、私募股权等等在互联网上呈现的信息。比如通过地图数据比对公司实际经营地址与工商注册地址是否一致,通过招聘数据看公司招聘人员的素质、通过对网站访问量的监测看公司是否投入太多资金做广告营销、从已经发生的非法集资案例中寻找共同特征等。
李崇纲解释:“好多非法集资的公司,不愿意让监管机构找到他们,所以经常经营地点与注册地点不一致。我们还会看这些公司的招聘信息,一般要是招初高中学历的销售人员,而且待遇超高,甚至是同行的2—3倍,这样的公司风险就比较大。再比如,如果一个公司网站短期内访问量激增,一般都是做了大量的广告营销,这部分成本太高的话,就有经营风险。”
这些特征综合起来,可以抽象出“合规性、特征词命中、传播力、收益率和投诉率”等五个特征指数。将上述五项指数加权、整合后,所测算出的数字,即是企业“冒烟指数”,代表其所涉非法集资风险。
北京市金融局的打非监测预警平台上线已经一年多。李崇纲称,根据事后的核验,大约有60%—70%的问题平台都能够提前有所察觉。但是这个效果目前还不好表述准确,因为预警之后,还有后续的立案、处理等诸多问题需要解决,大数据目前还不能解决所有问题。
目前,该平台已经对2000多家网贷平台展开了监测。李崇纲表示,今年监测的覆盖面还会扩大。同时,金信网银的团队也在努力优化冒烟指数模型,希望为每一种类型的金融机构建立专门的监测模型,并且希望利用机器学习找到更多特征与风险间的关联关系。
竞争正在展开
这个领域的竞争看起来正在渐渐展开。
就在本月,网贷天眼利用数据监测进行互联网金融风险分析的系统也已基本成型,这个监测模型不同于金信网银。金信网银目前的一些监测指标,未必是与金融业务相关的指标,但是网贷天眼希望通过对业务指标的监测来分析风险。
对网贷平台业务数据的监测是网贷天眼的长项。网贷天眼成立于2012年3月,是P2P行业两家最大的第三方平台之一,此前一直在做网贷行业数据监测,目前接入了200多家平台的数据。
网贷天眼联合创始人兼CEO田维赢称,网贷天眼监测的业务指标包括:根据网贷平台的贷款余额来判断平台的资金流动性、网贷平台的数据异常、资产类别、市场环比等,这些指标还会结合企业信息变动监控、舆情监控和针对某些平台的重点监控。
他举例解释,比如对贷款余额的监控。贷款余额指至某一节点日期为止,借款人尚未归还放款人的贷款总额。如果一个平台的贷款余额是30亿,但它排前10名的贷款人总共的贷款余额占比过高的话,其中如果有一个人违约,平台就面临很大的风险。再比如,如果新增借款标的在短期内猛增,就有可能有问题,因为在现实中要寻找合适的借款标的是需要花时间的,如果短期内猛增,很有可能是虚构的标的。
田维赢表示,他们已经与北京市金融局接触过几次,对方对他们的模型很感兴趣,双方正在探讨合作的可能。
类似的分析方法已经在实践中被证明是有效的。之前曾报道过,资深P2P投资人羿飞目前一直在做“羿飞网贷评级”,这个榜单监测的网贷平台业务数据包括:借款标的的平均利率、月成交量、平均借款周期、月活跃投资人、人均投资额、人均借款额、交易额增长率,再综合品牌认知、风控保障、服务品质,一共十项指标,并且对这些指标进行打分排名。
羿飞说,自从采用这种分析方法之后,他只踩过一次“雷”,是因为那个网贷平台在线下有很大的业务量,他事先并不知情。由于个人精力有限,羿飞只对三四十家平台进行监测,而且监测的平台会不断更新,不断地剔除他认为不靠谱的平台,并且增加新的口碑不错的待观察的平台。他告诉记者,陆续剔除的十几家平台当中,有10家左右都倒闭了,这种分析方法帮助他成功躲开了风险。
可是有时,数据监测有些“道高一尺、魔高一丈”的感觉。P2P投资人章雨(化名)曾于2013年到2014年间在一家做数据监测的网站工作过,他发现早期网贷平台的数据是比较真实的,网贷数据监测平台出现之后,网贷平台会根据这些平台的监测维度修改数据,以掩盖自己的问题。
用大数据监测互联网金融风险的道路,才刚刚开始。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09