
大数据时代的用户信息安全三原则
随着大数据时代的到来,互联网也将走到一个奇点,而安全将决定互联网走过这个奇点之后,到底是向上走到一个新高度,还是向下走到一个坏局面。大数据时代,有两个事情无法避免。首先,现在用户产生的数据都会存在云端,都会存在各个厂商的服务器上。第二,数据采集能力更强大,采集范围更广阔。
现在不仅有移动互联网,未来还会有物联网、车联网,会有更多的可穿戴智能设备,这些硬件普及之后,你会发现用户使用这些设备产生的数据规模将是空前的。在移动互联网上,厂商对用户了解之深入,是PC互联网完全不能比的。
比如,原来在PC互联网里,所谓用户信息,就用户存下来的那点艳照,而且很可能是还存在本地目录里。但有了智能手机以后,手机变成了你的钱包,而且手机里有太多私密的东西。一旦你丢了手机,就会产生很多问题。
一个行业大佬跟我讲过他的智能冰箱梦想。冰箱按成本价卖,一分钱不赚。我问那你最终靠什么赚钱呢?他回答说,我在冰箱里设置了好多摄像头,而且冰箱接入互联网。以后中国13亿人民买多少鸡蛋,买了多少青菜,放在里面有没有过期,我全都知道。这些数据里面就有很大的商业机会呀。
我想,那也是,现在的智能手环可以随时记录你的运动数据,你半夜干点什么厂商通过分析数据就能知道。以后很可能灯泡都要连上Wifi,插座都要连Wifi,最近我看到的一条新闻是,连城管都戴智能眼镜来执法了。
中国已经有10亿互联网用户,但是将来连接互联网的设备不只是10亿台,因为每个人可能同时有多种智能设备联网,可能50亿台,可能是100亿台,这么多设备产生的数据会让一个人变得越来越透明。当大数据时代来临,这些用户信息能不能保证足够的安全,这将是一个奇点,决定这个拐点何去何从。
最近,互联网行业出了很多安全事故,例如曝出SSL心脏流血漏洞,还有电商公司存储了用户信用卡里不该存储的信息。
在未来两三年里,这个情况会变得特别严重。你会发现,安全问题已经不是说在你的电脑、手机上杀病毒,清理插件。汽车现在正向智能化发展,无人驾驶汽车已经开发出来,软件是汽车智能化的基础。任何软件都有漏洞,软件功能越多,就越复杂;软件越复杂,出现漏洞的可能性就越大。如果黑客发现了漏洞,攻破这个软件,黑客就有可能通过远程云数据交换,从云端控制这个汽车。这就不是一个电脑重新格式化的问题,而是生命安全的问题。
如果在大数据时代,安全不能得到保障,那么或者用户不再信任你,不敢选择你。就像今天曝出心脏流血漏洞,很多人立刻就把手机和网银解绑,有的电商存储了用户信用卡的CVV码,有的用户就选择抵制这家公司。另一种可能,是消费者都无知无觉,但完全不知道自己把什么数据交给了厂商,也不知道厂商如何处理。一旦再出重大安全事故,那甚至将导致一定程度的社会混乱。如果没有足够强大的安全保障,云计算和大数据向未来发展,必将付出惨重的代价。
我们所有的互联网从业者都要考虑一下,如何在憧憬大数据产生商业效益的时候,也考虑一下如何更好的保护用户信息这个问题。当年阿西莫夫在很多科幻小中提出了着名的机器人三原则,就是为了防范机器人取代人类等安全问题。
那么现在,我认为也需要在大数据来临的时候,大家一起抛弃门户之间,携手共同制定一个用户信息安全三原则,来自我约束,自我监督。
第一,用户的信息是用户的个人资产。很多互联网大公司可能比较抵制我这个观点,因为互联网大公司在用户协议里说:因为用户号码是我给的,所以用户是我的,用户的好友列表也是我的,用户产生的内容也是我的。但是,它又发表一个免责声明,说用户产生的任何法律问题,都与自己无关。先不说这种自相矛盾的逻辑,我的观点是,用户使用厂商的服务产生的信息,是属于用户自己的个人资产。用户使用各种设备、各种软件产生的数据,虽然存储在厂商的服务器上,但是从所有权方面讲,它应该明确地属于用户,是用户的财产。
二是平等交换的原则。在大数据时代,通过云端的数据交换,厂商为用户提供服务。只要用户使用了厂商的服务,就会有相关的数据产生。你用微信的时候,为了匹配朋友,你的地址本自然要上传。为了与朋友聊天,你的聊天记录自然会保存在厂商的服务器上。但是,用户的信息和厂商之间,应该遵循平等交换的原则。什么叫平等交换?用户享受服务,厂商获取信息,但在这个过程中,用户要有知情权,厂商要得到用户授权才能使用用户信息,也就是说,用户要有选择权,有拒绝权。
举个例子,如果是一个类似大众点评这样的应用,因为要根据用户的地点给他找饭馆,自然它需要用户的位置信息,我认为这是合理的。这就是平等交换。但如果是一个小说阅读软件,也要获取用户的位置信息,我认为这个服务就不再是一个平等的交换,实际上它要了不该要的东西。平等交换原则也符合《消费者权益保护法》的基本原则,就是消费者要有知情权、选择权。
三是安全处理原则。有的人认为安全就是互联网安全公司干的事,就是杀毒软件的事,我觉得这个观点是错的。任何一家互联网公司,包括现在做可穿戴硬件的公司,都会变成一个互联网服务公司,用户会使用这些硬件产生大量的数据。所以,任何一家互联网公司都有责任保护用户信息的安全,要在云端对用户数据进行足够强度的加密,包括安全存储和安全传输。
只有用户觉得自己的信息是安全的,用户放心,他们才会更大胆地去尝试各种新的互联网服务。如果像大家每天在网上看到的,都是你说我的支付不安全,我说你的红包有危险。最后的结果是什么?很多人会说,反正在网上用手机支付不安全,那我就不用了。如果是这样,互联网想繁荣,我觉得是不可能的。
所以,这个三原则不是我们一家公司的问题,也不是几家安全公司的问题,而是从巨头到各位创业公司,大家要共同推动的事情。我们这些互联网行业里的人有责任给用户建立一个安全的基础。所以是时候抛弃门户之见了!将三原则推行起来,让用户对互联网建立真正的信心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28