
信用大数据 大数据信用体系 大数据信用体系建设
大数据开辟信用体系建设新路径
数据怎么体现出它的价值?最直接的体现叫数据变现。数据能不能跟金融对接起来,就是一个最直接的价值体现。
信用现在是一个高频词,如果不把这个基石重新建立起来,重新给它做踏实了,经济是没法往下走的。
西方信用体系的建立,约束的是结果,是约束“信”这个字。守信了,就得到了一个好的结果,失信了,就得到一个坏的结果。信用,另一个字是“用”,“用”是什么?我们认为它是个体创造财富的能力。如果我们把现在所谓的风险前置管理,或者是创造财富的能力量化,能把这件事情说清楚了,我们就能够走一条新的信用体系建设的道路。
量化,要从数据入手。不是所有的数据都有用,互联网上大量的数据都是垃圾,数据怎么体现出它的价值?最直接的体现叫数据变现。数据能不能跟金融对接起来,就是一个最直接的价值体现。另外,供应链里的数据含金量也非常高,它是一个企业核心的数据。
让大数据成为信用建设的“矿产资源”
全国人大代表、浪潮集团有限公司董事长孙丕恕在今年两会期间,提出了依靠大数据、建设征信体系的建议。他希望政府在制定宏观政策,建立征信法律法规的基础上,大力推进政府数据和机构数据等不同数据源的开放和共享,充分利用大数据技术,整合利用好各方数据。此前多年,他一直呼吁提升中国信息安全保护水平、完善中国信息安全保障体系等方面的建设。
在孙丕恕看来,大数据丰富了信用数据的数据源,不再局限于传统的金融领域数据,更基于交易数据、公共事业数据、商业信用、社会信用等多方面的数据来综合评判信用主体。数据的开放和整合是必经之路,大数据技术是有效支撑。
经济观察报:大数据在建设社会信用体系方面作用很大,但推进难度也不小,存在一些瓶颈。
孙丕恕:随着电子商务、移动互联等技术的发展,商业社会和人民群众的数据信息成为信用建设的重要“矿产资源”,尤其是大数据技术的应用,极大拓展了数据源的广度和深度,大幅提高了授信效率和信用评价的全面性、完善度等。因此,建设高效全面的社会信用体系需要充分发挥大数据的作用。
经过30多年的发展,中国已形成金融信用信息基础数据库及征信机构,依托央行也初步建立了个人征信数据库。同时,新兴的互联网公司依靠聚集的大量企业和个人的数据资源,也涉足金融和商业征信领域,成为征信市场的新兴力量。依靠大数据技术融合不同数据源、进而打造信用数据处理能力和信用产品并推广应用,成为创新社会信用体系的突破口。
大数据在信用体系建设方面的探索和实践
本干货出自2015年4月8日,金电联行(北京)信息技术有限公司执行副总裁艾小缤在清华-青岛大数据工程研究中心启动仪式暨大数据产业高峰会上所做的《大数据在信用体系建设方面的探索和实践》的演讲,这是该系列干货的第一篇。
演讲正文:
大家下午好。今天非常荣幸,其实这也是我近期第五次来青岛,之前来了几次,尤其是去年清华办了一个大数据峰会,当时也是我来讲。经过了这一段时间,我相信其实现在大家对大数据的认识越来越充分,越来越深入,包括今天上午,各位专家都讲了很多。我们现在可能对大数据感觉不陌生了,但是我们跟在座的各位有什么关系呢?我觉得在大数据这个时代,这个可能是我们所有人更关心的一个问题。
先说说信用。互联网+大数据,我们说互联网+的概念,但实际上我们说大数据本身也是一个很底层的,我们很有可能在后面会产生大数据,其实已经产生了很多大数据+金融、大数据+房地产、大数据医疗,它跟互联网有什么不一样的地方呢?我觉得互联网在前面,互联网实际上是影响了我们整个的生活,它的影响我们其实还能够接触到,还能够理解到,但是大数据的影响,我估计现在可能大家还没有真正接触到,甚至只是听说它对我们生活有哪些影响。今天我来讲一讲大数据在信用体系建设和在金融领域方面有哪些应用,这些跟我们有哪些关系。
大数据监管的信用力量
前段时间,国办印发了《关于运用大数据加强对市场主体服务和监管的若干意见》,全文出现大数据一词61次,出现信用一词94次,尤见信用和大数据之间的紧密关系。我们理解,实施信用的基础是信息,信息是来自数据的加工。
前段时间,国办印发了《关于运用大数据加强对市场主体服务和监管的若干意见》,全文出现大数据一词61次,出现信用一词94次,尤见信用和大数据之间的紧密关系。我们理解,实施信用的基础是信息,信息是来自数据的加工。
大数据是基础、是工具,信用是应用、是方式。让市场充分发挥资源配置的优势和作用,缺乏信用是万万不行的。
首先,大数据在哪里?无非是履职过程中掌握的数据,包括登记机关掌握的法人和其他组织的登记信息,自然人的登记信息。另外一块就是行政许可、审批、行政处罚、行政强制、行政征收、行政给付、行政裁决、行政确认、行政奖励、其他行政权力,包括一些财政专项资金分配、审核转报、行政调解、行政监督检查、行政复议等。均是客观反映行政相对人的记录。
征信大数据:我的信用,我来决定
你曾经试过信用卡逾期未还款吗?如果我告诉你逾期还款三次以上,会影响你日后贷款的利息,你可能就不会轻易忘记还款了。信用分数一直是个黑盒子,人们不知道自己为何会得到这样的评分,得不到适时反馈的结果是我行我素,甚至自暴自弃算了。
每一次我们悔不当初的时候,心里总会想:早知道就好了。其实,眼下大部分的现实反馈都是滞后的:等体检才知道“三高”,等完全失眠才知道喝太多咖啡有问题,而这时候再采取弥补和改正的措施可能已经晚了。未来,大数据可以帮我们“早知道”一点吗?进一步讲,未来大数据可以帮助我们迅速纠正错误的判断和行为吗?答案必然是肯定的,因为大数据的内涵来自量化与关联,但价值最容易体现的是准确的反馈基础上得到的预判。
现实中已经有很好的例子,比如健康手环,实时的收集生活活动包括走路、休息、睡眠、心率等数据,让我们更好地自律,更健康地生活。根据这些数据的反馈,我可以马上采取修正行动。
今天为大家介绍的一家创新金融公司是一个打破“信息黑盒子”的真实案例。这家公司叫Credit Karma,他们的业务完全基于信用数据, 继而发展到繁多的个人金融服务。该公司成立于2007年, 目前已经达到4,000万用户。占美国人口的12%, 非常可观。在美国credit score信用分数至关重要,大到房屋贷款,小到租房租车,对一个人的信用判断都强烈依赖于信用分数。
张韶峰:大数据重构中国信用体
下面我将重点阐述一下对大数据重构中国信用体系的一些思考。
各位都了解,自去年以来,国家密集出台开展社会信用体系建设的各种规划和实施意见。
由此预判,未来几年,应该是在国家主导下、在市场机构的参与下,共同探索和建立全民社会信用体系。
目前,中国的零售金融领域以及征信领域,落后于美国二三十年,但是互联网领域却只和美国相差两三年,甚至在某些细分领域还领先于美国。这样的差距以及中国巨大的市场机会,使得中国的金融发展不会走和美国相同的路径,而是会利用最先进的技术如移动互联网、云计算、大数据技术,跳跃式发展到一个新的模式阶段——互联网金融和大数据征信。
这个预测并非空穴来风,人民银行潘功胜行长在近期一次公开会议上特别提出,利用新技术条件发展新业态征信是需要积极面对的课题。央行对大数据公司进入征信系统持开放态度,并称预计不久将有大数据公司进入征信市场提供征信服务。
利用大数据来做征信,就是要把多种类型的数据绑定到一起,那这些数据怎么来,如何去组合,怎么计算,摆在我们面前的既是机会也是挑战。
我想给大家介绍的是,(一)传统的风险建模思路
20世纪50年代,一位工程师费尔(Bill Fair)和一位数学家艾塞科(Earl Isaac)发明了一个信用分的统计模型,80年代开始在美国流行,如今它是美国费爱哲(Fair Isaac)公司的专有产品——费爱哲评分(FICO)。美国三大征信机构都使用该信用分,每一份信用报告上都附有该信用分,以致费爱哲信用分成为信用分的代名词。
费爱哲信用分模型(以下简称传统模型)利用高达100万的大样本数据,首先确定刻画消费者的信用、品德,以及支付能力的指标,再把各个指标分成若干个档次以及各个档次的得分,然后计算每个指标的加权,最后得到消费者的总得分。传统模型的打分范围是300~850,三大征信机构各自输出自己的信用分数,分数越高,信用记录越好,三家的分数不能完全替代使用,但差别不大,相差在20分以内。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22基于 Python response.text 的科技新闻数据清洗去噪实践 在通过 Python requests 库的 response.text 获取 API 数据后,原始数据 ...
2025-08-21基于 Python response.text 的科技新闻综述 在 Python 网络爬虫与 API 调用场景中,response.text 是 requests 库发起请求后获取 ...
2025-08-21数据治理新浪潮:CDA 数据分析师的战略价值与驱动逻辑 一、数据治理的多维驱动引擎 在数字经济与人工智能深度融合的时代,数据治 ...
2025-08-21Power BI 热力地图制作指南:从数据准备到实战分析 在数据可视化领域,热力地图凭借 “直观呈现数据密度与分布趋势” 的核心优势 ...
2025-08-20PyTorch 矩阵运算加速库:从原理到实践的全面解析 在深度学习领域,矩阵运算堪称 “计算基石”。无论是卷积神经网络(CNN)中的 ...
2025-08-20数据建模:CDA 数据分析师的核心驱动力 在数字经济浪潮中,数据已成为企业决策的核心资产。CDA(Certified Data Analyst)数据分 ...
2025-08-20KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-20偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18CDA 数据分析师:驾驭表格结构数据的核心角色与实践应用 在企业日常数据存储与分析场景中,表格结构数据(如 Excel 表格、数据库 ...
2025-08-18PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14