京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据要充分利用 但更要保护用户隐私
全球进入移动互联网时代后,一个巨大进步是一切活动都在往移动互联网这个舞台上转移。所有社会活动、金融交易等都在网络上留下了痕迹或者说有迹可循。由此带来的进步是革命性、历史性和颠覆性的。
通过对人们在网络上留下的印记进行采集、挖掘、提炼与分析,可以分析出背后许多经济金融文化等有巨大价值的东西。思想支配行动,行动又反映思想。从网络上的留印行动中挖掘分析后就可以基本得出其思想所在,从网络上对一个主体各个方面留痕进行大挖掘、大计算、大分析基本就可以摸清楚预测出来这个主体想要什么,需求何在?这就可以分类施策、细分客户、精准营销。这个商业价值是无限的。
此前,马云曾讲过,大数据、云计算诞生以后,经济或可以进入到计划经济体制里。计划经济与市场经济都是配置资源的手段。计划经济之所以比市场经济在效率等方面低、弊端多,不在于计划经济体制本身,而在于没有技术等手段与能力来实现计划经济的高效性与准确性。现在有了网络,有了网上大数据的积累,有了云计算,或给计划经济以重新复活的机会,给了计划经济体制优越性以证明的机会。插上大数据、云计算翅膀的计划经济或比市场经济更加高效,更加精准,对市场的周期性破坏或就此消失。
这就是所说的大数据是一座大金库的原因。不过,这个大金库要充分挖掘与发挥出来的话,一个大前提是要对大数据进行充分采集、挖掘、整理、甄别、分类、分析等。这个大数据中包括你我他几乎全部在网络上的百姓民众消费者。也就是说,每一个在网络上留下印记即数据的你我他都是被分析的对象。这就牵扯到另一个问题:隐私保护问题。
近期,用户在查阅自己的支付宝年度账单时默认勾选“我同意《芝麻服务协议》”这件事引起一阵波澜,蚂蚁金服也回应道歉了。无论处于什么好意,默认勾选“同意”肯定是不合适的。不过,从这件事中的一些争论反应看,确实存在着一些对大数据在采集使用与隐私保护上的较大偏差甚至是糊涂认识,需要以理性的思考予以梳理厘清。
只要你在网络上留下了印记即数据基本上没有隐私可言。即使线下交易也基本如此。例如:过去你到银行办理存款贷款汇款,你到房管所办理房子登记过户,你到派出所办理户口入户迁移,你办理入学入托上大学等等都要登记家庭、身份证、电话等基本情况与信息。现在在网络上同样如此。只要存在这些情况,你的信息或者隐私就已经裸露出来了。
这里一个关键问题必须甄别清楚,每一个人在网络积累的大数据不让采集挖掘分析使用可能是做不到的。关键在于如何使用?在于使用后一定要为客户的隐私以及普通信息数据保密。保密,是问题的关键所在。只要有交易,就一定要使用你的数据。比如,你有贷款信用需求,这个金融交易一定要充分使用你的数据信息的。关键在于使用以后,不能泄露给第三方。所谓的保护隐私数据,主要的问题就在这里。
非金融信用业务也有保护数据信息隐私问题。你去一个网站注册、你想使用共享单车都需要注册相关信息数据的。注册这些数据信息以后,你不能说不让网站等挖掘使用你的数据信息,注册时也等于是一种交易,除非你不注册。关键问题还在于,网站、共享单车等使用客户数据后,一定要为客户保密。
这里面牵扯第三方使用数据如何办的问题。我个人认为,牵扯所有经济体的金融信用数据问题,各大平台包括央行在内都可以共享信用等级数据。目的在于形成一种“有信走遍天下,无信寸步难行”的社会氛围与高压态势,使有信用者得以提倡褒扬,无信用者如过街老鼠人人喊打。全社会形成:信用贵如金子,无信耻辱透顶,这才能形成信用的正向激励机制。
第三方使用其他数据,网站等平台应该通过协议约束征得被采集人的同意。同样,必须有约束条款,第三方也必须为客户数据信息保密。
总之,大数据这座金矿必须充分利用使用与挖掘开采,不能造成大数据资源的闲置和浪费,同时,使用以后关键在于要保护好被采集数据者的数据信息以及隐私。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01