京公网安备 11010802034615号
经营许可证编号:京B2-20210330
互联网征信陷“数据孤岛”_数据分析师
互联网征信究竟可不可信,随着大数据征信的逐渐变现,这一话题再掀波澜。支付宝“芝麻信用”界面悄然上线信贷产品“好期贷”;京东白条也正在与 51信用卡合作开发系统为用户增加征信,而其风控依赖的标准主要是互联网征信。在复杂的互联网时代,线上数据的准确性有待商榷,国内的互联网征信实则是 “雾里看花,水中望月”。
大数据征信追逐赛开始
互联网企业的创新速度一向是火箭级别。今年初,央行开放个人征信市场,8家机构获得准入资格,拉卡拉、蚂蚁金服、腾讯等互联网企业抢得准入证,随后,各家企业就展开了一场追逐赛。
以蚂蚁金服旗下的“芝麻信用分”打头炮的芝麻信用进度最快,除了“花呗”、租车、住宿等产品外,芝麻信用界面近日又悄然接入了招联消费金融有限 公司的信贷产品“好期贷”,芝麻信用评分达到700分的用户即可在线申请1万元以内的贷款。此外,以芝麻信用分作为审批依据的产品“借呗”也将上线,额度 上限达到5万元。
拉卡拉则推出了个人和商户两类信用分,个人信用分可以在拉卡拉App中查询,数据集中于一个独立平台,任何一个使用POS机的商户都可以到考拉 征信体系里面评估他的商户信用分,当商户的信用分达到一个级别以上,就可以跟拉卡拉申请贷款,不需要抵押和担保,并且贷款的利率根据信用分来评定。此外, 拉卡拉还推出了企业信用分。
互联网征信日益流行,越来越多的信贷产品使用互联网征信体系提高风控、拓展业务。北京商报记者近日了解到,京东白条也准备引入51信用卡管家为用户增加征信,目前正在系统开发阶段,双方的合作模式相当于设立一张“联名信用卡”为用户增信。
对于互联网征信,其来源是互联网金融平台沉淀的大数据,并通过数据建模,最终输出每个人的诚信模型,以此为标准,系统自动判断可以借给谁钱、借多少。不过,由于互联网金融在国内兴起的时间尚不足两年,大数据征信的可靠性和含金量仍被不少业内人士质疑。
线上信息准确性待商榷
互联网时代各个行业瞬息万变,比如对于互联网征信依赖较大的P2P行业,此前不少平台都宣称自己为“纯线上的信息中介”,但是在行业发展几年以后,不少P2P平台仍然选择了线下布局,一方面可以节约成本,另一方面则是通过线下风控降低风险。
但是仍有不少互联网金融行业人士宣称单纯依靠大数据模型、人像建模等技术进行风控。
开鑫贷副总经理周治翰直言,如果要支持小微企业,靠纯线上的风控模式不够现实,首先没有完备的线上交易记录,没有国外完善的征信系统,小微企业 主可能连网上提交申请都不会。同时,如果电商企业根据交易商户或者个人的流水来判定征信情况或者进行风控,也存在不准确的可能,比如个人的购物情况看起来 虽然交易量较大,但可能是帮助其他人或者企业进行采购,所以单纯依靠线上数据可能有很多虚假信息。
同时,比如P2P行业服务的大都是传统金融机构无法覆盖的人群,这些人也许从未在银行等金融机构有借贷或信用卡使用,而借助大数据征信可抓取的数据有效性又有多高?
据公开数据显示,央行征信中心的数据覆盖人口达到8亿人,但是其中真正有信贷记录的仅3亿人,5亿人没有任何信贷记录。而中国的个人征信报告, 目前只是各商业银行历史信用数据的汇集,现在大量原始数据都分散在金融机构、司法、工商、税务、公用事业单位等部门,想要获得这些数据并不容易,这导致大 数据征信缺乏数据支持和依托。
金信网首席运营官安丹方认为,用大数据进行信用评估时,很多数据会涉及个人隐私,尤其是对个人社交圈和电商交易的数据、通话记录、微博数据的应 用。目前国内关于个人隐私方面的保护几乎处于空白,过快推进大数据征信,企业将有可能面临法律和道德风险。而国内对失信行为的惩戒制度不够健全,导致借款 人违约成本较低,难以有效抑制违约风险。“民间机构的交易数据形态各异,对数据的定义不同、业务操作规范不同,授信标准也不同,很难形成统一的数据标准供 行业共享。而征信企业之间存在竞争,数据是各家企业的核心资产,想要实现信息数据的共享难度也比较大。”安丹方直言。
融360 CEO叶大清也认为,中国目前的征信体系还不足以支撑银行在线放款。传统银行的劣势是只有线下没有线上,但现在互联网时代的趋势让用户把时间都花在线上 了。线下是一个过去的时代,线上是一个新的时代,最好的模式是线上线下结合。线下做两件事,风险控制和服务。
民间版征信如何进化
虽然业内人士对于大数据征信的准确性仍持有意见,但不可否认的是,国内的征信市场未来将越来越开放,民间版征信的适用范围也会逐步拓展。那么,大数据征信该如何增强自己的信用价值呢?
有分析人士表示,互联网征信机构需要不断完善评估模型,充分发挥大数据优势,提高大数据分析模型和方法。改进和完善现有模型、探索和建立新的模 型,使大数据在互联网征信领域进一步发挥作用。在海量数据中挖掘数据之间的内在联系以及预测数据变化趋势,特别是对客户属性、交易记录、评价信息以及商品 信息进行合理预测。
周治翰认为,互联网征信目前仍需要进行多重交叉验证,即使是征信市场较为完善的美国和德国,通过多个模型交叉验证数据的真假也是必不可少的环节。
在安丹方看来,大数据征信应当以立法为先。她表示,目前大数据征信的发展还存在数据缺失、隐私信息界定不明等问题,大数据征信的推进应以征信立 法为先。为了规范大数据征信、减少隐私侵害,《个人信息保护法》应尽快出台;针对数据缺失,大量原始数据分散在司法、工商等政府部门的情况,建立在立法层 面使数据采集从私法授权的方式改为公权力授权,即当央行授予民间征信机构征信牌照之后,该机构即拥有央行的公权力授权,可以直接对接拥有原始数据的机关、 企事业单位,但涉及法定保密信息的除外。
“中国的征信必然会崛起于网络时代,但是需要完善相关法条保驾护航,否则大数据征信推进得越快,恐怕带来的隐患就越多。”安丹方建议,在中国征 信体系尚未真正建立起来前,大数据征信应循序渐进的推进,平台可以把其作为风控的补充,但不宜完全依赖。就目前发展而言,以大数据征信为基础的大数据风控 至少在短期内还无法取代以O2O为主的风控体系。
复制美国经验需时间
崛起于网络时代的大数据征信,是拯救者还是毁坏者?中国征信的未来,路在何方?没有完善的征信体系,就没有真正的互联网金融,因而征信体系如何建设从来都是行业争论的焦点,目前国内对于国外征信行业的经验尤其看重。
美国最大信用评级公司FICO中国区副总裁Sandy Wang表示,美国征信的发展史经历了四个阶段:第一个阶段是疯狂发展的过程,第二个阶段是监管成熟的过程,第三个阶段是合并整合的过程,第四个阶段就是 现在由几家龙头企业主宰的成熟期。当下,中国的征信市场处于第一个时期,市场蓬勃发展,出现多家小而美的征信公司。但是征信的趋势还是要规模化,相信未来 一定还是会出现几家寡头征信企业。
叶大清表示,美国在上世纪90年代互联网刚刚兴起的时候,1994-1999年就开始做网上申请房贷、信用卡、贷款,用户体验非常好,可以做到 1分钟在线审批。之所以能做到这种水平,是因为当互联网在美国兴起的时候,美国银行已经很成熟了,已经具备了数据分析能力、风险控制能力和决策能力。
在国内,市场是这样的,“大数据方面其实大家说得多、做得少。京东、腾讯、阿里甚至银行的数据都不全面。而微众银行更多拥有的是社交、行为及QQ浏览器等基于互联网的数据,到现在为止还没有风控方面的数据。
反过来看银行,银行积累了十几年甚至几十年,它知道放过的款借款人都是谁、收入如何、信用怎么样等,这些借贷数据很详细,但如果一个人从来没有在银行产生过借贷行为,那么银行就判断不了。所以说,互联网的数据和银行的数据各有优劣”。叶大清直言。
比如FICO的模式就是,首先基于信贷的五类记录(还款历史、当前负债、信贷历史长度等)作为传统的FICO分数的打分基础,虽然强大,但是由 于打分需要的最少记录要求导致整体人群的覆盖范围有限,所以越来越多的第二类非信贷数据被引进到FICO的Alternative Credit Data中(比如电信记录、公共事业费记录、公共记录和房产记录等)。
值得一提的是,目前国内部分P2P行业已经引入FICO,但是由于国内的数据缺失和准确性问题,FICO在中国的应用也需要经过很长时间的调整和实践修正才能逐渐作为参考采用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13