京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据第一案,微博为什么赢了
本周数据安全领域发生了两件事,一件大事一件小事,前者是支付宝密码漏洞事件,知道的人很多,搞得满城风雨。幸好支付宝处理漏洞的速度很快,迅速的就堵上了这个漏洞。后者是微博赢得了“脉脉非法抓取使用微博用户信息”案件的胜利,这个案件虽然比不上支付宝那个热度,但是对于从事数据分析行业的我来说确是足够震撼。并且这个案件的判罚,不仅仅和微博相关,其实和每一个互联网用户都有很大的关系。
这两个案例,第一个是系统的漏洞(Bug),修改程序堵上就行了。第二个却揭开了大数据背景下数据安全,数据过度营销的黑幕,它对社会的危害反而是最大的,需要企业、国家机构、甚至我们每个人一起来维护数据安全,所以微博和脉脉的案例反而是一个大事件。这是行业标杆性的一个判罚,在几个方面都有突破,所以今天和大家好好聊聊这个案子。
微博、脉脉案件背景
相信很多人第一眼是将脉脉看成陌陌了,其实脉脉和陌陌一样都是做人脉社交的应用,只不过陌陌是基于LBS(位置服务)的陌生人群社交应用,脉脉是基于工作关系的熟人社交应用。
之前脉脉和微博有过合作,脉脉通过微博的API接口打通了微博和脉脉的认证体系,用户可以使用微博账号注册登录脉脉,一旦用户同意使用微博账号注册脉脉,脉脉就可以获取该用户的微博名、头像、性别、职业、教育等信息(注意这个过程是用户授权的,但很多人懒,以至于注册时不会主动勾掉这些选项)。用户可通过微博账号和个人手机号注册登录脉脉,现在几乎所有的应用都要求用户提供手机号,用来接受验证码。但是为了人脉关系链条的需要,脉脉在用户注册时还要求用户上传个人手机通讯录的联系人信息(当然这个动作也是需要用户授权的)。
本来说上传手机通讯录不关微博什么事情,问题是微博随后来发现,脉脉用户的“一度人脉”中,大量非脉脉用户在人脉关系链中,直接显示有他们的的头像、名称、职业、教育等信息。这是什么意思?就是脉脉利用手机号进行匹配微博账号,非法的抓取了这些没有授权的用户信息,并且用于商业用途。
虽然通过合作网站注册登录已经是一种非常普遍的行为,微博、微信、QQ、支付宝都支持这种了注册登录方式,不过这次脉脉显然有越位之嫌。
脉脉为什么输了?
其实脉脉已经输过一次了,2016年4月北京市海淀区人民法院审结该案,认定北京淘友天下技术有限公司和北京淘友天下科技发展有限公司(就是脉脉的营运方)非法抓取、使用新浪微博用户信息等行为构成不正当竞争。但是脉脉不服,于是提起上诉,2016年12月30日北京知识产权法院做出终审判决,驳回上诉维持原判。
互联网的本质是开放、平等、协作、分享,但开放并不是没有底线,平等并不是没有规则,协作和分享也一定是基于用户意愿的基础上。个人觉得脉脉其实是输在了以下几点:
1、非法获取用户信息,并用于商业化。
脉脉的职场社交做的就是熟人社交,而熟人社交中最重要的一个环节是关系链,关系链不能打通,不知道你是谁,这只是陌生人的社交。所以获取关系链的数据就尤为重要,利用微博API接口,脉脉非法获取了用户没有授权的信息,并且在“一度人脉”中进行了展示,其他人则能够看到这些没有被授权的信息。第三方公司抓取微博数据用于商业化,不仅仅侵犯了用户的权利,也构成对微博的侵权,这当然是非法的,微博自然可以进行起诉。
2、脉脉的行为构成了不正当竞争
咱们国家的《反不当竞争法》明确规定:经营者不得采用以盗窃、利诱、胁迫或者其他不正当手段获取权利人的商业秘密。也不可以未经允许披露、使用或者允许他人使用其所掌握的商业秘密。对微博来说,用户信息的关系链就是它的商业秘密,法院当然会支持微博的这种诉求。
3、脉脉没有起到保护用户信息的作用
大数据时代,每个企业都有责任去保护用户的个人信息,并且大家都有义务一起推动数据生态的繁荣。相反脉脉不但没有去保护用户的信息,反而是进行了商业应用,并把这些信息展示在自己的“一度人脉”中,让更多的人看到。
这起案件的行业意义
虽然这个案件是按照不正当竞争来判决的,其实本质上是个人信息安全保护权的争夺。这个案例,一审在北京市海淀区人民法院审结,终审判决在北京知识产权法院,两级法院都支持了微博的诉求,也有一些实质性的突破,这对未来类似案件的审理提供了参考价值。
以往的类似重大诉讼,法院判决的处罚金额基本为几十万元,通常不超过50万元,此案罚金大幅提高到200万元。这个现象体现了司法部门对数据保护的重视程度,这也将促进大数据应用变得更加规范。现在利用数据过度营销的案例比比皆是,也有很多公司在打擦边球,所以希望通过这个案例能逐步规范大数据的使用。企业如果再不规范自己和第三方数据的使用,就可能被告上法庭被处巨额罚金。
第二个突破是,用户授权同意了的数据就可以安全的使用了吗?答案是否定的。第三方使用时,不但需要用户授权,还需要平台授权才可以。北京知识产权法院提到第三方应用通过开放平台例如Open API模式获取用户信息时应坚持“用户授权”+“平台授权”+“用户授权”的三重授权原则。听起来好麻烦,其实这正是数据安全性的多维保护,不但用户需要保护自己的信息,平台方也需要建立规则保护用户数据。所以不要以为用户同意了的数据就可以随便使用了,别拿用户说事儿。
数据是企业的一项竞争力,是可以获利的商业资源,同样也需要被保护。北京知识产权法院支持了这个观点:互联网络中,用户信息已经成为今后数据经济中提升效率、支撑创新最重要的基本元素之一。因此,数据的获取和使用,不仅能成为企业竞争优势的来源,更能为企业创造更多的经济效益,是经营者重要的竞争优势与商业资源。因此,网络平台提供方可以就他人未经许可擅自使用其经过用户同意收集并使用的用户数据信息主张权利。
同时北京知识产权法院也提到,数据提供方不仅应将用户数据信息作为竞争优势来加以保护,还应将保护用户数据信息作为企业的社会责任,采取相应的技术措施提升相应权限的控制,通过接口调用的检测以及保存调用过程的控制,不断完善Open API合作模式。
大数据时代,各平台方都有责任和义务推动数据生态的繁荣,积极建立数据使用规则,对那些滥用数据,过度使用数据额行为进行制止。否则,就将是现代社会的一场悲剧。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-12-23CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-23在Power BI数据可视化分析中,矩阵是多维度数据汇总的核心工具,而“动态计算平均值”则是矩阵分析的高频需求——无论是按类别计 ...
2025-12-23在SQL数据分析场景中,“日期转期间”是高频核心需求——无论是按日、周、月、季度还是年度统计数据,都需要将原始的日期/时间字 ...
2025-12-23在数据驱动决策的浪潮中,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越“整理数据、输出报表”的基础层面,转 ...
2025-12-23在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15