京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据征信六大难题待解
随着消费金融、网络借贷等互联网消费模式快速增长,以及大数据技术突飞猛进,大数据征信服务机构开始大量涌现。但多元化、多层次征信市场体系建设面临一系列挑战,有很多难题尚未破解。
一是数据的质量、共识性问题。相比于央行征信系统的共识性、数据质量的高可靠性,大数据征信机构虽然数据来源更加宽泛、品种更加丰富,但数据质量、共识性受到质疑。美国国家消费者法律中心2014年3月对主要的大数据征信公司进行调查后并发表了题为《大数据,个人信用评分的大失望》的调查报告,报告称,大数据征信公司的信息错误率高于50%。这些公司的数据模型繁多又复杂,使用不准确的数据,有“垃圾进,垃圾出”之嫌。
二是同人不同信用问题。决定大数据模型预测准确性的两个关键因素是数据和算法,各家征信机构的基因不同,数据来源不同。目前八家机构中,鹏远、中诚信、中智诚是传统型的征信机构,数据来源主要是金融数据、公共数据为主,而芝麻、腾讯、前海、考拉、华道则除了接入传统数据外,主要大量用的是自身场景下积累的数据,这导致信用评估结果在不同公司间存在差异。
三是个人隐私保护及信息安全问题。根据《征信业管理条例》规定,采集和应用个人征信信息必须要获得征信主体授权,商业银行在向人民银行征信中心报送和查询使用个人征信信息时,必须严格执行此规定,对于报送数据范围、查询用途范围、授权形式、异议处理等都有明确的界定。而大数据征信依赖大量个人的互联网交易记录、社交网络数据,在多重交易和多方接入的情况下,隐私保护的权利边界被淡化,隐私泄露风险被迅速放大,公民维护自己合法权益面临取证难、诉讼难等问题。
四是公共信息的可获取、跨机构信息的可交换问题。如前分析,目前多家个人征信试点机构的信息来源带有浓厚的自身经营特点,申请个人征信试点机构大多首先拥有自己的具有垄断性的数据资源。而大数据征信要求的是信息的共享,而不是局部的垄断和壁垒。跨机构拥有的信息是否可交换,哪些需要获得信息主体的授权,如何保证交换过程和交换后信息不被滥用,在法律、监管、技术等方面都缺乏标准。同时,工商、税务、司法等公共政务信息的可持续获取,尚得不到保证。目前的主要做法是,各家征信机构或信息使用机构分散地获取这类信息,获取成本高,数据质量和数据的可持续维护得不到保证。
五是信息滥用带来的社会安全、公平交易问题。从首批试点的八家个人征信机构的运营情况看,市场开放之后,芝麻信用、腾讯征信、考拉征信等机构开始了一轮激烈的追逐赛,纷纷推出各自的评分产品,并争相在金融、购物、招聘、租车、租房、交友、酒店入住等领域尝试应用。但是,这些机构绘制出的人物“肖像”能否真实反映个人信用还令人质疑,获取信息所采用的关键技术的可靠性还有待进一步检验,没有制约的商业化应用很可能带来安全隐忧或消费歧视。
六是征信机构的独立性问题。从各国征信机构的发展历程看,狭义的征信主要是为放贷机构的风险管理提供信息支持的活动,遵循“信息采集者与信息产生没有任何关系”的独立第三方原则。而目前试点的几家征信机构多不是独立的第三方,一方面他们的数据来源于母公司,另一方面其兄弟公司又涉足放贷业务。评分结果对于其各自经营领域的客户分析、风险判断具有强相关性,但其他应用场景下评分结果的相关性则有待验证。
总之,围绕建立多元化的征信体系这一大目标,需要在健全信用管理法律法规,完善信用数据标准体系,加快各类公共信用信息基础平台建设,强化征信业监管等方面多方探索,既要大力推进,又要脚踏实地,不能指望一蹴而就。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12