京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何让大数据更懂金融?征信公司都拼了
强烈的市场需求,不足的市场供给,已经迅速点燃我国征信行业。对金融机构而言,征信将完善对风险的评估和管理,有利于加快授信过程,分级定价,降低优质借款人借贷成本,大幅提高信贷效率。对商业机构而言,征信逐渐被作为经济运行和社会管理的标准,以此撬动的商业模式创新迅速拓展至酒店、租房、招聘、旅游等行业。
据中国企业联合会数据显示,中国市场每年因为诚信缺失造成的经济损失约为5,000多亿元。对比美国征信行业的发展,中国征信业还处在初级阶段,既蕴含巨大市场空间,更需要众多参与者不断探索。
个人征信行业竞争激烈 "三驾马车"雏形初现
2015年1月,腾讯征信、芝麻信用、前海征信等八家机构获准开展个人征信业务,这让业内着实沸腾,很多人都在欢呼个人征信市场的春天已经到来。然而时至今日,八家机构苦等19个月仍然未盼到牌照。好在,个人征信市场的发展,并没有因为牌照迟迟不发而停滞不前。经过一年多的运营,一些领军企业已取得不错的进展。
比如,芝麻信用称,目前有接近60家数据合作伙伴,各场景的合作伙伴已超过200家。腾讯征信表示,已经与浦发银行、广发银行的信用卡业务展开了合作,另有多家合作方进入产品调试、试用阶段。
相比于上述两位BAT中的大拿,具有金融血统的前海征信明显在公关上低调很多。但根据近期《经济观察报》的一则报道披露,目前前海征信已为近1500家机构提供征信服务,覆盖银行、P2P、小贷、消费金融等信贷机构,其中银行客户达115家。
前海征信背靠中国经营最好的全牌照综合金融集团——平安集团,意味着坐拥近亿相对高净值金融客户数据。平安又是金融集团中互联网业务布局最早、最广的,拥有2亿互联网用户,这对前海征信而言又是一笔宝贵的资产。此外,前海征信还与政府机构、外部数据合作伙伴等合作,并加入新型互联网行为数据,在人脸识别、大数据挖掘技术上重点突破,在一年多时间内推出覆盖贷前、贷中、贷后的多款征信产品,在B端市场优势明显。
其他拥有个人征信业务准入资质的五家企业,无论在规模上还是在数据来源上都无法与腾讯征信、芝麻信用、前海征信这三家相比肩。因此,有业内人士将这三家称之为征信领域的"三驾马车"。此外,京东金融、百度金融、小米、宜信等30多家企业也有意申请第二批个人征信牌照。
个人征信公司各自为战 "数据孤岛"如何破解?
源源不断的后来者,在不停地为这个行业的竞争加码。然而各家机构跑马圈地,攻城略地之时,难掩个人征信当下面临"数据孤岛"带来的最大挑战。
个人征信行业所需的三大类数据——金融数据、政府公共服务数据、生活数据分别散落在各主体机构中。大量民间借贷、互联网金融数据未能实现统一的征集和标准化处理。政府公共服务数据则是由公检法、税务、教育及其他企事业单位分别披露。生活类数据分散在各类场景中,线上线下数据混杂。
以芝麻信用和腾讯征信为例,芝麻分自称考虑了个人用户的信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度的信息,其中来自淘宝、支付宝等"阿里系"的数据占 30-40%。
而腾讯征信主要是基于社交网络,利用其大数据平台 TDBank,重点采集并处理包括即时通信、 SNS、电商交易、虚拟消费、关系链、游戏行为、媒体行为和基础画像等数据,并利用统计学、传统机器学习的方法,得出用户信用得分,为用户建立基于互联网信息的个人征信报告。
在BAT几大互联网巨头剧烈竞争割据的当下,很难想象芝麻信用和腾讯征信会互享数据。而电商数据、社交数据在个人征信中如何应用,也备受争议。
一个简单的例子,"买包烟借钱和你开个烟店借钱,完全是两码事";而一个负债创办企业的年轻创业者,可能将房子抵押;可能会通过社交媒体工具向亲友求援;也许会减少开支网购,也许会买东西减压;为了在客户免签撑场面,也可能买来新车壮声势。
这样的多元场景,果真能通过互联网的网购数据,或者通过社交媒体,如微博的发言,去判断他的信用状况吗?
其实,不论是电商机构,金融机构还是其他信息机构,所掌握的数据都是完善的征信服务中的一角,如果站在严谨的大数据的全面信用审核来看,理论上是应该从这些个平台中依次获得个人消费领域,金融领域,安全领域等方面的数据,然后进行交叉比对和分析,并与央行个人征信数据进行一定的结合,才能得出效率最高的,覆盖面最广的征信服务。
让大数据更懂金融,这样的个人征信公司更有优势
数据孤岛难破,而在各大征信机构的竞争中,如何获取和解读基础征信数据亦成为挑战。在这些基础征信数据,除了身份记录和信贷记录之外,可能还必须纳入影子银行、互联网金融甚至民间金融等多样化的金融投资数据。
而在数据类型中,强变量是指信贷、信用卡、外汇、民间借贷等金融交易数据,往往掌握在传统金融机构手中;中变量是商品生产、销售、流通、消费等环节的交易数据,主要来自各类电商平台;弱变量则是社交、游戏等数据,大多源于互联网平台。
由此可见,金融属性的数据是最强相关的数据,而这类数据往往在传统金融机构手中。大多数个人征信机构能够获取的,是社交记录、个人消费记录等相对弱相关的数据,但却难以获取最为重要的金融数据,导致有效数据比较有限。
在传统金融体系中,这些数据是相对割裂和分散的,尤其是对亲属和社交网络的数据监测可能是一个难点,要突破这一难点,更多的需要激活传统金融体系的创新能力,这一工作,需要传统金融企业,尤其是拥有全牌照金融能力的企业做出创新,前海征信或许正是最有潜力的一家。
目前,前海征信的合作机构数近1500家,以银行、P2P平台和小贷公司、消费金融为主。从前海征信的业务布局来看,其产品体系以贷前、贷中、贷后来布局,包括欺诈类,信用类等几十款征信产品,为金融机构提供全流程的风控解决方案。而且,前海征信尤其重视互联网金融领域,针对中国互联网金融发展现况,定制了灵活、完整的产品体系,能满足互联网金融机构和传统金融机构各种不同的风控需求。
然而,创新并不容易。因为银行业内的征信和风控体系是以大额资产和应收债权为核心的,互联网领域的征信分析目前更多聚焦在相对小额的消费贷款业务。如何能真正融合二者,还有待破题。
互联网金融倒逼大数据征信迎头赶上
中国的大数据征信,被远远甩在国外同行身后,这也是央行开始要逐步开放个人征信业务的准入资质的动力。
数据显示,截至2015年末,央行征信中心有效覆盖8.8亿人信息,其中仅有3.8亿人有信贷记录。波士顿咨询近期报告显示,央行个人征信记录覆盖率为35%,即使考虑到中国55%的城镇化率,城镇人口个人征信覆盖率仅61%,远低于美国92%的覆盖率。
此外,近年中国互联网金融的发展速度惊人。遍地开花的网络支付,一夜之间兴起的P2P,如火如荼的消费金融,带来机遇与危机共存的复杂局面。一方面,央行征信中心覆盖率不足,且收录的以传统银行提供的借贷信息为主;另一方面,网贷领域在经历开天辟地的发展和变化,互联网征信,尤其是大数据征信的发展成为了当务之急。
当前,个人征信时代不断更替,随着央行征信管理局向各大征信机构下发了《征信业务管理办法(草稿)》(以下简称《草稿》),对信息采集、信用使用以及征信产品进行了规范。难怪有评论认为,个人征信牌照只差临门一脚。
一旦牌照正式发布,以内外部大数据和互联网新技术为依托的个人征信,不仅能进一步深化了金融机构风险管理的内涵,也有望使我国个人征信迎来再一次创新和飞跃,不仅能促进个人征信业务进一步市场化发展,更使信用应用场景从金融服务延伸到生活服务,让每一个诚信、守信的人,都能享受到拥有好信用带来的实惠和便利。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25