
大数据行业生死劫
6月1日,《网络安全法》落地实施已过去三个月,大数据行业结束野蛮时代,进入洗牌期。
此前有15家数据公司被调查,此后,名单扩大到30家;多家公司的业务负责人被约谈,他们甚至相互打招呼的方式,都变成了“今天,你被抓了吗”;大量数据接口关停,数据产品停售,导致部分公司开始裁员,一家被调查的公司,甚至将大数据业务完全下架,退出市场。
一些公司黯然退场,一些却高调入局——一些有独家数据源的公司,在最近宣布成立。
数据行业,正处于二八分流,冰火两重天。
01“你被抓了吗?”2017年5月末,数据行业的清理行动开始。
据多位知情人透露,“数据堂”多人被警方调查,导致部分数据业务线停摆。
此后,数据堂发表声明称,因公司某一客户存在被公安机关调查的情形,公安机关为进一步了解具体情况,向公司个别业务人员及财务人员进行情况了解,不存在“公司高管被抓”的情形;公司业务运作正常。
目前,数据堂的官网可正常打开,但“数据定制—数据堂”的网站页面,却无法打开。
大数据行业生死劫:上万接口关停,大量公司裁员,90%公司将倒闭今年8月,数据堂发布股票停牌公告,称因存在“预计应披露的重大信息在披露前已难以保密或已经泄露,或公共媒体出现与公司有关传司,可能或已经对股票转让价格产生较大影响的”事项,2017年8月14日起暂停转让,预计股票恢复转让日期不晚于2017年11月13日。
“公司走了很多人,还有一些人准备拿完年终奖就走”,数据堂离职员工杨青称,“目前,精准营销线和大数据线基本暂停,现在仅靠人工智能一条业务线支撑”。
但杨青同时指出:“公司的海外客户,暂时没有受到影响。”
这只是大数据行业进入冰封时代的一个缩影。
一本财经曾独家报道,15家数据公司被调查,名单中不乏估值几十亿的大公司。据知情人透露,此后,调查范围则进一步扩大,“名单已有30家”。
行业一度风声鹤唳,传闻满天飞。
头部的大数据公司,都曾传出过CEO或高层被调查的“小道消息”。
网传聚信立的高管也被带去问话,业务呈收缩状态。
聚信立CEO罗皓不得不站出来辟谣,紧急接受媒体采访:“我敢否认,说明我们没有被约谈。”
“实际上,确实很多公司的业务负责人被约谈”,行业资深从业者罗锦江称,为了取证,通常电脑等存储设备也会被拿走。
一位大数据行业的CEO听到传闻,另外一家公司的创始人被调查,他急忙在微信上询问:“你没事吧?”
对方回复没事,说是谣言。
结果第二天,CEO又听到消息,接着再问:“今天你被抓了吗?”
“今天你被抓了吗”,这句话一度成为大数据行业高层从业者的问候语。
02接口切断几乎行业所有的人都明白,这次数据整顿,是为了6月1日新推出的《网络安全法》预热。
“这次是动真格了,毫无容情”,罗锦江称,5月底,很多公司主动将一些敏感业务线停掉。
“数据供应商突然间通知我们,业务暂停,但会支付违约金”,某信贷公司的商务负责人陈希称,最先被停掉的接口,就是“三要素”查询。
“所谓三要素,就是手机、姓名、身份证”,罗锦江称,以前的价格,“购买一条仅7毛、8毛”。
多位行业从业者称,三要素停了之后,大部分公司只提供两要素(身份证和姓名)的“验证”。
“把两个信息提供给数据方,对方只会反馈一个是与否的答案”,陈希称,如果符合,反馈“是”,如果不符合,反馈“否”。
陈希紧急修改了风控规则,让业务线可以勉强推进,但紧接着,更多的接口被切断。
以前一次查询2元的学历数据接口停掉,随后,车辆、住房、公积金等数据接口都全面切断。
“我们只能再次修改风控,让用户自己填写用户名和密码,授权我们去相应的页面爬取数据”,陈希称,如此操作大大提高了风控的成本和用户体验,“但合规了”。
紧接着,各项“特色”的数据产品也悄然撤下,或开始变得不稳定。
而某平台的风控总监郭飞透露发现:“今年年初,百融金服的产品收支等级,查询突然变得不太稳定,缺失率很高”。
所谓的收支等级,就是一个人信用卡和储蓄卡的入账和出账记录,并按照等级给出分数,数字远大,金额越大。
△ 收支等级产品说明
郭飞称,这项数据,是信贷中很有价值的数据,查询一次的价格是2-3元。
但至于如此隐秘的金融数据,百融金服是如何拿到的,在业内一直是一个谜团。
华道征信的业务员称:“自6月份后,不良信息的查询、资产类,目前我们是暂停服务”。
媒体报道,为了规避政策风险,在《网络安全法》实施前,同盾停掉了“失联人修复”服务;中国移动下属全资子公司中移在线,也停掉了“移动三要素”的查询。
一边是主动停止合作,一边是客户直接跑单。
贷后邦的商务负责人称:“部分客户已与我们达成合作意向,规定一出来他们很害怕,所有关于数据的业务都暂时不接,我手上有一两例违约客户。”
大量接口断了后,行业开始了裁员潮。
头部的大数据公司,都曾传出过裁员消息。
“主要裁掉的,是销售和一些敏感业务线的人”,罗锦江称,大量的乙方公司业务人员被裁掉后,就进入了甲方公司。
03艰难求生2012年,马云在网商大会上震耳发聩地喊出:我们将进入大数据时代。
那一年,阿里巴巴集团设立了“首席数据官”一职,并推出大型数据分享平台“聚石塔”——这是中国大数据行业开始爆发的信号弹。
而大数据行业黄金年代的来临,是在2013年互联网金融崛起之后。
大数据和在线信贷相结合,激发了强烈的化学反应。
在黄金浪潮中,崛起了上万家的大数据供应商,他们采集数据,进行清洗加工,针对不同的应用场景,再输出不同的产品。
“早期,部分大数据公司的商业模式,极为简单,很多都是黑市采买数据后,简单打包,直接销售给客户”,罗锦江将其称为大数据的野蛮时代。
“在这里,就是大数据的天堂”,从美国回国创业的某CRO称,刚回国的时候,发现国内数据流通尺度之大,完全超乎想象。
在美国,很多并不敏感的数据,都无法用在信贷领域,比如,性别、人种颜色、年龄段,都不可随意参考,不然,就可能涉及“歧视女性、黑人或老人”。
滥用的用户数据,让大家就如裸泳一般,毫无隐私可言。
持续数年的数据之乱,终于在“徐玉玉”案之后,将行业推到了众矢之的的深渊。
这似乎成了诸多行业宿命,总是在鼎盛狂欢中,在利益催化之下,出现浮华泡沫。随后,巨大行业负面爆发,监管如期而至,洗牌来临。
校园贷和大数据行业,都是同样的轨迹。
行业正在挣扎中自救。
曾经很多大力宣传自己是专注大数据的公司,如今,对外的传播口径完全变动。
“行业污名化,不想和大数据扯上关系,外面现在都称自己是人工智能公司”,一位从业者称。
南京一家大数据公司也在被调查的30家名单中,目前,公司已将大数据业务全部关停,正在谋求转型。
“连我们业务员都需要加班加点看项目”,一家数据公司的商务称,公司甚至让他们去找项目,寻找出路。
大部分的数据提供商,正在寻找第一条自救之路:数据的脱敏、加密。
最常见的方式,就是查询结果的输出上,采取打分制,比如,如果完全匹配,就是100分,如果只有一半匹配,就是50分。
而查询不良则是用信息比对,输入名字身份证,输出命中与否。
还有一些公司,尝试用技术,保护用户隐私。如拨打催收电话,直接进行加密,只能看到一个加密号码拨出。
行业想到第二条自救之路:联合建模。
双方开发一套系统,直接放在客户公司的内部,双方共享数据,系统最终输出一个分数或结果。
“联合建模,确实解决了合规问题,能够使双方共享数据”,小赢科技首席风控官成少勇指出,从长远角度来说,这肯定是未来趋势,但目前,推进的过程依然困难重重。
今年8月,郭飞的公司和一家数据公司合作,对方提出了联合建模,但公司内部引发了争论。
“对于我们来说,增加了很大的工作量,我们不可能针对每家数据源都要去做建模,且联合建模的费用是十万”,郭飞称。
“实际上,现在大部分的联合建模,数据公司只是沦为一个技术提供商,这个模式太重,”大数据公司CEO林欣称,如果一家数据公司有20个客户,就得有20个建模师。
对于双方来说,这个模式重,成本高,为了合规都要付出代价。
04行业洗牌《网络安全法》出台后,要获取、使用用户的数据,都需要用户授权。
而第三方的数据公司,很难再用这种方式获取数据。
林欣认为,这样的公司,无非只有两个命运:要么在原有的老数据基础上,挖掘建模,但这样的产品,很快就会过时;要么就变成技术提供商和咨询商,比如联合建模。但这个命运,也不能让人愉悦。
如果变成技术提供商,很难和大的公司合作。因为,大的公司数据和风控,都视为核心部门,很少外包;其次,大的公司对数据提供商也百般挑剔。
因此,数据公司几乎只能给小的公司提供技术服务。
“大的公司,从6月之后,都要求数据提供商签一个承诺书,确保使用的数据,都是经过用户授权的”,罗锦江称,基本没几家公司敢签字。
行业的最终命运如何?
“行业90%的公司将被淘汰”,多位行业从业者都下了如此的判断。
有意思的是,一边是死亡,一边又是生长。
就在9月25日,联通大数据公司成立。
“未来,有一类大数据公司能活得不错,就是拥有稀缺数据源的公司”,林欣称。
而成少勇也是同样的观点,只有独家、且不断更新的数据公司,才有竞争力,“二八格局已非常明显”。
对于此次洗牌大潮,大多从业者表示,并非坏事。
劣币被驱逐,良币才能沐浴阳光,茁壮生长。
去芜存菁,正本清源,大数据行业的野蛮时代终于结束。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-252025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-25从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-25用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18