京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据征信六大难题待解
随着消费金融、网络借贷等互联网消费模式快速增长,以及大数据技术突飞猛进,大数据征信服务机构开始大量涌现。但多元化、多层次征信市场体系建设面临一系列挑战,有很多难题尚未破解。
一是数据的质量、共识性问题。相比于央行征信系统的共识性、数据质量的高可靠性,大数据征信机构虽然数据来源更加宽泛、品种更加丰富,但数据质量、共识性受到质疑。美国国家消费者法律中心2014年3月对主要的大数据征信公司进行调查后并发表了题为《大数据,个人信用评分的大失望》的调查报告,报告称,大数据征信公司的信息错误率高于50%。这些公司的数据模型繁多又复杂,使用不准确的数据,有“垃圾进,垃圾出”之嫌。
二是同人不同信用问题。决定大数据模型预测准确性的两个关键因素是数据和算法,各家征信机构的基因不同,数据来源不同。目前八家机构中,鹏远、中诚信、中智诚是传统型的征信机构,数据来源主要是金融数据、公共数据为主,而芝麻、腾讯、前海、考拉、华道则除了接入传统数据外,主要大量用的是自身场景下积累的数据,这导致信用评估结果在不同公司间存在差异。
三是个人隐私保护及信息安全问题。根据《征信业管理条例》规定,采集和应用个人征信信息必须要获得征信主体授权,商业银行在向人民银行征信中心报送和查询使用个人征信信息时,必须严格执行此规定,对于报送数据范围、查询用途范围、授权形式、异议处理等都有明确的界定。而大数据征信依赖大量个人的互联网交易记录、社交网络数据,在多重交易和多方接入的情况下,隐私保护的权利边界被淡化,隐私泄露风险被迅速放大,公民维护自己合法权益面临取证难、诉讼难等问题。
四是公共信息的可获取、跨机构信息的可交换问题。如前分析,目前多家个人征信试点机构的信息来源带有浓厚的自身经营特点,申请个人征信试点机构大多首先拥有自己的具有垄断性的数据资源。而大数据征信要求的是信息的共享,而不是局部的垄断和壁垒。跨机构拥有的信息是否可交换,哪些需要获得信息主体的授权,如何保证交换过程和交换后信息不被滥用,在法律、监管、技术等方面都缺乏标准。同时,工商、税务、司法等公共政务信息的可持续获取,尚得不到保证。目前的主要做法是,各家征信机构或信息使用机构分散地获取这类信息,获取成本高,数据质量和数据的可持续维护得不到保证。
五是信息滥用带来的社会安全、公平交易问题。从首批试点的八家个人征信机构的运营情况看,市场开放之后,芝麻信用、腾讯征信、考拉征信等机构开始了一轮激烈的追逐赛,纷纷推出各自的评分产品,并争相在金融、购物、招聘、租车、租房、交友、酒店入住等领域尝试应用。但是,这些机构绘制出的人物“肖像”能否真实反映个人信用还令人质疑,获取信息所采用的关键技术的可靠性还有待进一步检验,没有制约的商业化应用很可能带来安全隐忧或消费歧视。
六是征信机构的独立性问题。从各国征信机构的发展历程看,狭义的征信主要是为放贷机构的风险管理提供信息支持的活动,遵循“信息采集者与信息产生没有任何关系”的独立第三方原则。而目前试点的几家征信机构多不是独立的第三方,一方面他们的数据来源于母公司,另一方面其兄弟公司又涉足放贷业务。评分结果对于其各自经营领域的客户分析、风险判断具有强相关性,但其他应用场景下评分结果的相关性则有待验证。
总之,围绕建立多元化的征信体系这一大目标,需要在健全信用管理法律法规,完善信用数据标准体系,加快各类公共信用信息基础平台建设,强化征信业监管等方面多方探索,既要大力推进,又要脚踏实地,不能指望一蹴而就。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22