京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据与个人征信市场发展
互联网、移动互联网产生大数据,云计算为大数据挖掘提供了技术支撑,信息技术发展为金融服务长尾客户提供了可能,也为普惠金融的发展提供技术支撑。金融服务需要以征信为基础,市场催生了需求,也唤醒市场对投资征信业的热情。在互联网、大数据、云计算的大背景之下,中国的征信业应该如何发展?在网络个人信息无处不在的情况下,如何处理好个人信息安全与征信业发展的关系?市场翘首以待的个人征信牌照发放还有哪些认识需要统一?
大数据背景下征信无处不在,很多人也都在谈征信,但是,大家实际是在不同层次上使用不同概念谈论征信。到底应该怎样认识当前中国的征信市场?
第一,个人信用征信。传统个人信用征信是个人信用状况的评估,与个人的资金活动相联系,反映个人债务状况和资金延迟支付状况,包括缴费、纳税等。凡是与个人资金运作有关系,一般来说应该算作个人信用征信。在国外,谈到个人信用征信,一般有很多维度,美国使用最多的信用评分(FICO)主要参考付款历史、欠款数据、信用历史时长、新的信用帐户、使用的信用帐户五个维度信息,全部与资金有关。但是,近些年来,个人征信机构也在参考资金收付有关的个人行为数据,包括水电费缴纳,等等。
第二,个人诚信。现在社会上经常提到的所谓征信,其实并不完全是信用征信,而是涉及很多诚信行为。个人诚信是对个人契约精神的评估,与个人合同履约状况相联系,与信用评估有关联,但不是决定性因素。社会诚信建设很大程度是道德规范,让守信者方便,失信者受惩戒。现在各行各业发布黑名单、白名单,其实有很多信息中他们的行为与资金并没有完全关系,而是反映的履约情况。
第三,行为征信。互联网、大数据和云计算使得数据拥有者能够对客户行为偏好做出分析,对客户的偿债能力、支付能力、履约和欺诈倾向有所分析,用好大数据可能有助于反欺诈和提供差异化服务以及市场营销。但是,对金融授信的风控作用有待检验。现在很多人在挖掘的是行为数据,这些行为数据反映的行为偏好不一定能够完全用于金融授信,但是可以对金融授信有一些参考。
第四,数据服务。这类服务提供者不直接掌握数据资源,主要是围绕大数据征信提供第三方技术和服务,包括大数据挖掘,在数据源上层完成数据分析和风险控制。很多拥有数据的公司都想做大数据分析,也有一些技术公司想对这些大数据做分析服务。这些和金融界所说的典型的个人信用征信不完全一致,有关联但不是同一个事情。
上面就是对当前社会谈到个人征信业时涉及到的四个层次的分析。我认为针对个人征信市场的不同层次、不同需求,应该实行差异化监管。个人信用征信主要服务于金融授信活动。
世界近百年发展历史证明,只有独立第三方开展个人信用征信才更有公信力,也才更公正。为金融授信服务的个人信用征信要由独立第三方负责,因为只有这样做才没有利益冲突或利益关联,因而没有行为扭曲。为了使自己的信用分数提高一些,有人是不是可能有意多去使用与征信因素有关的服务?这种行为社会上是存在的,背后其实就隐含着一定行为扭曲。
独立第三方数据源清晰,可以通过合同、外部接口规范、数据库审计等方式管理,数据留存可以使信息可追溯、可异议、可纠错,有利于保护个人信息安全。在互联网时代,每一个人的信息都可能上网,保护不好就会对个人隐私造成侵犯。在数据化时代,个人数据就是个人的无形财产,应该得到很好的保护。独立第三方征信也可以从技术手段上更好保证信息安全。独立第三方没有利益竞争,有利于解决信息孤岛问题。如果每一个信息源都想靠自己掌握的信息和别人竞争,有利益竞争就会导致信息不共享,容易形成信息孤岛。个人信用征信由第三方评估,更容易形成统一认识。
独立第三方的标志是什么?现在最大的争议点就在于此。给出几个标准,第一,公司治理独立,高管、资产、财务、人员独立不受个别股东控制,有一个独立公司治理结构,在公司独立运作过程中不能被个别股东操纵。第二,数据来源多元独立,分析模型独立。第三,业务独立,不参与信息源和使用者同范围的业务。业界讨论该问题时有不同意见。香港证监会所属香港证券及投资学会出版的信贷评级服务及惯例,将独立性和利益冲突界定为“业务不受现有或潜在的有关业务关系,或与任何其他方的任何业务关系,或潜在业务关系的影响,或因不存在上述关系而受影响”。这句话通俗说,因为做评估涉及相关业务,或相关人员,使得业务受到影响,或者说没有相关业务和相关人员,也受到影响,因为与他们没有关系,所以不能够受到公平公正待遇,这也是一种影响。
公共机构与市场机构协同发展,要发挥中国人民银行征信中心公共平台作用,向社会提供公平公正的信用征信服务。市场化独立第三方从事个人信用征信,市场化机构从事专项个人征信服务及数据服务。市场化个人征信服务还是应该分层次。
个人征信市场监管有自身原则。第一,保护个人信息知情权,让被征信主体客户知道征信机构收集了哪些信息,客户要有选择权、拒绝权和遗忘权,信息可追溯、可异议,可纠错。给出评分,也要公布评分要素,到底是怎么评估的,外界要知道评估方法,如果对评分有不同意见可以提出异议,错了要可纠错。
第二,要确保个人信息安全不泄露。通过规章制度保障、物理安全保障、技术安全保障,严格运营监管个人数据的授权与使用,确保个人信息安全不泄露。个人信息也是个人财产,而服务机构在服务过程中也做了很多工作,因此,数据在某种程度上是服务机构和个人共同拥有的。
如果个人对自己的信息提出查询,或者授权其他机构查询,拥有数据的人或单位应该允许查询,而且应该为查询提供便利。既然数据服务机构提供了服务,某种程度上也有数据一定所有权,在不暴露个人隐私、脱敏之后可以加工信息,做商业化处理,这也应该受到法律保护。《网络安全法》对此也予以确认,但是前提条件是必须脱敏,不能涉及具体个人,比如张三李四在干什么,关注某个群体有怎样行为特征,类似信息可以加工处理。
第三,要维护市场公开公平公正有序竞争,对不同层次的征信机构实行差异化监管。
在监管方面,我认为个人征信机构工商登记应该实行“先证后照”。个人征信服务涉及个人信息安全和隐私保护,必须有金融市场准入,实行“先证后照”。企业征信由于不涉及企业商业秘密且企业信息公开性强,可实行工商登记后的备案管理。投资企业征信的公司到工商注册,然后到监管当局、人民银行备案就可以。但是个人征信业必须是批准之后才能开展。目前人民银行批准了八家机构在做个人征信准备工作。因为没有管理经验,必须通过实践总结经验。个人征信应该是先到监管当局获得许可,然后再到工商登记。当然,这个问题现在也有争议,希望能够听到各方面的意见。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30