
大数据时代:数据即信用,信用即数据
数据的联通,让人们日常生活、工作中的各种行为彼此相连、互相印证。
天地万物中,人最难管,有道是:人心似海。
例如,在火车上如何有效的约束抽烟者就一直是个难题。
绿皮火车时代,曾经的车厢连接处常常被强占为吸烟区。但因为窗户可以拉开,二手烟的问题大家感受不深,吸了也就吸了。随着动车、高铁的普及,车厢全封闭,吸烟的问题凸显出来。
2014年《铁路安全管理条例》实施,规定在动车组上吸烟可处500-2000元罚款。但是,这一条款有时也会演变为闹剧,曾经就有乘客 “求罚款”以换吸烟。
直到最近,铁路部门才有了管用的新办法:从8月15日起,乘客若在动车上吸烟,铁路系统将暂停向其发售车票,乘客需签订协议书后才能再买车票;若发现二次吸烟,将直接“禁乘”,不再对其出售车票。
毫无疑问,这一禁烟令的出台,有赖于最近几年开始普及的电子售票体系以及火车票实名制,让每一张车票卖给了谁都一清二楚,一个人的行为可以记录到他的名下。
数据的本质在于记录。
易容术,人前人后两张皮
这几天,我还关注到一条新闻:《命案逃犯潜逃16年 漂白身份成寺庙住持》。2000年,一名黑龙江男子杀害3人后潜逃至安徽凤阳县的龙兴寺出家。这之后,一路“成长”为寺庙住持、佛教协会副会长、政协委员。结果因为一次偶发的事件,当地警方通过人像比对发现了他的破绽。
由于位置偏僻,历史上,佛道寺庙常常是“藏污纳垢”之地,所谓““放下屠刀立地成佛,苦海无边回头是岸”,说的其实是来去自由的意思。当然,英雄也可能隐居在这里,他们不显山露水。正是因为缺少数据和记录,没人说得清楚这些人的身世和来历。
在金庸的小说《天龙八部》里,要论心智计谋,慕容博是第一人,为了复兴大梦,他长达三十年在吐蕃、大理、大宋、大辽几个政权间拨弄是非,堪称全书中的最佳导演。还有藏得更深的,一个扫地僧竟然是绝世高手,隐居少林藏经阁大半辈子,在最后关头突然出手、然后一锤定音。
《天龙八部》中的慕容博是名伪装高手
数据孤立时,个人的行为之间也是孤立的,每个人仿佛都是易容高手,也会分身术,人前一个模样人后一个模样。数据联通时,行为与行为将打破时空阻隔产生联系。2012年,四川内江壕子口派出所的民警在进行“一标三实”(标准地址、实有人口、实有房屋、实有单位)登记,将当地一名僧人信息传入电脑系统时,竟然发现他是一起诈骗案的主角。
数据的联通,让人们日常生活、工作中的各种行为彼此相连、互相印证。
在浙江安吉,子女探望老人的次数在尽孝这一老大难问题上派上了用场。安吉的天子湖镇高禹村修建了浙江最大的村级老年公寓。在老人入住前,子女需签订一份合同,上面规定了子女需每月探望。探望次数将被如实记录,村里据此给予奖惩。违反3次以上,村里就会通知子女把老人接回家赡养,同时按约取消当年的福利。
探望老人和村里的福利,原本彼此孤立的行为由此串联起来并发生关系。
不同的数据记录了人们在不同时空的行为,看似毫不相干,但可以有千丝万缕的联系。大数据的普及给了我们一个机会,去创造更灿烂辉煌的文明法则。
透明人,一张全方位的“立体画像”
中国的传统社会是个熟人社会,个人信用关系建立于血缘和情感之上,亲疏关系、地缘位置往往决定了一个人的可靠程度。所以,我们常常可以看到这样的事,他是朋友间的好知己,邻居眼里的热心人,在熟人面前通情达礼,可换个场景,他又很可能是公共场所破坏规则、自私自利的那个人。
在一个缺乏契约精神的社会里,保守信用和承诺靠的就是个人的修行。随着社会自然关系的断裂,传统的信用关系在一个陌生人社会里失去了约束力。
美国学者弗里德曼(Lawrence M. Friedman)在《美国法简史》中有一段关于“陌生人社会”的经典描述:“走在大街上,陌生人保护我们,如警察;陌生人也威胁我们,如罪犯。陌生人教育我们的孩子,建造我们的房子,用我们的钱投资……”熟人社会向陌生人社会的转型,对重构信任提出了要求。
如果说,中国传统的个人信用基础是人情、关系,那么,现代社会的个人信用就是数据。1837年,美国遭遇经济危机,银行倒闭,诈骗频发。这一年,美国首家信用公司成立,标志着美国社会信用体系建设的开始。其后几经努力、历经百年,美国成熟的信用体系最终为其商业繁荣奠定了有力的根基。
今年6月起,我所在的城市杭州开始为《公共信用信息管理办法》征求意见,其中,冒用他人证件、使用伪造证件、逃票乘坐公交,骗保、考试作弊、拖欠水电费等,都有可能被列为失信行为。这些失信数据保存在杭州公共信用平台上,最长将保管5年。有失信记录的人,在审批、投标、享受补贴等都可能受限制。
逃票乘坐公共交通工具也是失信
上海市,则将违法燃放烟花爆竹、垃圾分类、行车违章、图书归还记录等行为也纳入个人征信系统。此外,国内多地还拟将游客的不文明行为纳入个人信用体系,在文物上乱涂乱画等行为将可能影响出游。
相信未来还将有更多维度的数据被纳入个人信用体系。
一百多年来,美国信用体系的建设主要集中在家庭资产、借贷偿还、信用卡透支、诉讼等几个维度的数据之上,其实这些维度有很大的局限性。但随着大数据记录了人们工作、生活的方方面面,已经能够为每一个人画一张全方位的“立体画像”。你就是你,你的个人价值是由千万个行为界定的,你的行为决定了你在信用体系中的位次高低。人,在某种程度上说透明了,多维度的个人数据完全可以成为信用的多维参数,这比传统的信用评估方法更丰富、更精细,也更准确。
信用,就是一个人于此、于彼点点滴滴的数据积累。未来,一切和人的生活相关的数据,都可能成为评价其信用的来源。
我们正在进入“数据即信用,信用即数据”的时代。今天的中国,个人数据比过去任何时候都更为充沛,这是中国快速建立社会信用体系的后发机遇。一个城市,你做,还是不做,数据就在那里。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04