京公网安备 11010802034615号
经营许可证编号:京B2-20210330
互联网行业进入规范和监管时期 大数据行业也不例外
大数据产业仍处于非常早期的阶段,如同20年前的软件产业所处的阶段,未来想象空间非常大,但在发展过程中,势必经历从不成熟到成熟,从野蛮迈向规范,从泡沫回归理性。
“刷屏了,不发朋友圈担心别人以为与我有关。”近日,北京某大数据公司的负责人黄帆(化名)告诉21世纪经济报道记者,他转发了一条多家大数据公司被查的帖子,很快又删除。
尽管被帖子提名的公司随后发公告澄清“未被调查”,但创业者们已如惊弓之鸟。
21世纪经济报道记者采访国内十余家大数据公司和投资机构,很多人认为传闻言过其实,对被提名的创业公司是伤害。
但是他们都不否认,行业规范已经悄然开始,越来越多涉及用户数据隐私的案件发生,即便只是一批大数据公司被“协助了解情况”,给行业带来的震撼不可估量。
6月1日,《网络安全法》正式实施,也预示着行业规范正式拉开序幕。同天顺丰和菜鸟陷入数据大战,在数据资源方面互不让步,以保护用户数据隐私安全的名义掐架;在行业规范的大背景下,在数据资源争夺愈演愈烈中的创新创业,正在重新洗牌,大数据行业有望告别野蛮生长。
调查传闻
黄帆的公司业务之一,是数据服务。
5月末,他的公司跟提供数据服务的合作伙伴签协议时,换了一份更新版的合同。21世纪经济报道记者翻阅发现,这份合同相对过去来说,强化了保密和安全条款,包括甲方超出协议范围内使用本服务或造成泄漏滥用等后果,甲方承担全部责任。
在他看来,行业进入规范阶段,过去的一些数据交易相关的业务线已经叫停,跟一些公司的合作不得不中断。在他看来,现在法律刚刚实施,数据交易正在规范,要警惕踩红线。
让黄帆感到震撼的是,5月27日一条自媒体公众号发帖,传十余家大数据公司被调查,原因是公司提供涉及用户隐私的数据。
21世纪经济报道记者采访证实,传言有很多失实的部分,但不可否认的是,很多大数据商人开始紧张起来。5月末的贵州数博会上,多家大数据公司人士都在私下讨论行业规范的问题。
中关村一家大数据公司负责销售的副总告诉21世纪经济报道记者,他们的公司微信群,针对那条帖子讨论了很久关于风险的话题,有人幸灾乐祸,有人感到自身危机。
在他看来,从短期看,创业公司如果有涉及灰色地带的业务,会受影响。相对BAT大企业来说,创业公司在法务方面的实力弱一些,或者重视程度不够高,还有些创业公司扩张很快,对员工和业务的管理相对难以规范,不知会在哪里翻船。但他也表示,从长远来看,这是一个正常的大浪淘沙的过程,有利于行业健康发展。
5月31日,传闻被调查的大数据公司数据堂发布公告,称公司不存在“公司高管被抓”、“被立案调查”、“多条业务线停滞”的情形,互联网上相关报道所传闻事项与事实严重不符。
北京某大数据行业协会负责人表示,对企业调查传闻不愿多谈,网传文章有很多不符合事实的部分,对于点名公司来说很冤枉,负面影响不小。但从整个行业来说,给大家的震撼是很大的,相关话题的讨论和关注基本覆盖整个行业从业者,最近他见一些投资人,也都在咨询行业风险的问题。
“只要涉及到大数据公司,投资人都开始特别敏感起来。”上述行业协会人士说。
独角兽“失足”
“创新往往从灰色地带开始。”一家互联网巨头企业高管在接受21世纪经济报道记者采访时表示。
这句话用在大数据创业领域再合适不过,某部委专家也表示,大数据领域的创业,有些创新的商业模式,换另一个说法,也是灰色地带,创新和违法的界限,法律规范不太清晰,或者说有些领域本身已有法律规范,但此前没有执行,现在如果较真严打,或者有竞争对手攻击,就会有法律风险。
2016年以来,整个互联网行业进入规范和监管时期,大数据行业也不例外。
尽管行业鱼龙混杂,但能活到现在的大数据创业公司,创始门槛也都不算低。21世纪经济报道记者采访过数十家大数据公司,创始人大多都受过较好的教育,在其原先的职业有体面的收入,包括很多从国内科研院所、金融机构、BAT以及硅谷科技公司回来的70后和80后精英。
近期,一些大数据企业因为商业模式引发官司,甚至导致核心人员接受调查。
2016年武汉的一家数据公司,被竞争对手告上法庭,称其后台大量的信息数据被这家公司盗取,损失高达1亿。随后警方以涉嫌非法获取计算机系统数据罪对这家公司进行了立案侦查。
据媒体报道,被告公司高层于2016年6月初分别在杭州、北京被警方拘留,其中有5名人员因非法获取计算机系统数据罪被带回深圳接受调查。
21世纪经济报道记者采访获悉,该公司是大数据细分领域市场占有率最高的一家公司,获国内多家知名创投机构投资,被称为该细分领域的独角兽,目前公司业务一切照常运转,但是这对于陷入官司的创始人自身来说,算是一道坎儿。
当地政府部门一位熟悉该企业的官员反复对记者表示惋惜,当地好不容易冒出一家像样的科技公司,在行业竞争激烈的数据领域,创业公司不得不重视起法律风险来。
类似的案例,还有2016年末“新浪微博诉脉脉反不正当竞争案”中,北京知识产权法院对于脉脉利用Open API等不当手段,获取新浪微博用户信息的行为,通过《反不正当法》,判定脉脉违反了诚实信用的原则和公认的商业道德,损害新浪微博的合法权益,构成了“不正当竞争行为”。
国外的大数据公司Facebook也遭遇过不少涉及数据共享的官司,2017年法国隐私监管部门对Facebook处以15万欧元罚款,指责Facebook收集了大量个人数据用于定向广告,且未给予用户拒绝的选项,违反了法国数据保护规定。
一家风波中的创业公司中层表示,私下调解或者通过罚款解决问题,还能接受,如果CEO被带判刑,对创业公司来说,是很致命的打击。
上述大数据行业协会负责人分析,新兴行业都是如此,比如互联网行业也有公司因商业模式违法被关掉,CEO被判刑。大数据行业规范才刚刚开始,创业风险大家应该意识到,而不是只看到拿到融资的光鲜独角兽。
行业洗牌
“被调查”风波和《网络安全法》落地,几乎所有接受采访的业内人士都提到了“行业洗牌”。
中关村大数据产业联盟副秘书长陈新河告诉21世纪经济报道记者,灰色数据交易市场一直存在,不能全部怪罪在大数据身上。
“灰色数据交易市场不是因为这几年大数据火热才存在的,很多人有这样的印象,刚买完房子还没有装修,各种装修公司电话一个接一个,刚买完车,保险公司的电话便接踵而至;这几年大数据成为人们耳熟能详的流行词,在不明就里的情况下,很容易把灰色数据交易与大数据联系一起,事实上大数据创新创业公司非常重视数据的合规性,因为他们深知这条红线不能跨越,否则随时有关门的风险,同时也不能排除极个别公司跨越红线以身试法,因为灰色数据交易市场一直存在。”
井通网络科技CEO武源文曾在IT、大数据领域工作十余年,他认为这个行业目前能快速变现的商业模式主要是三种,第一种是为政府和机构做IT系统建设,企业要对行业背景了解深,很多大数据创业公司并不擅长;第二是做平台,IT领域的公司把控严格,竞争激烈,留给创业公司的机会不多;第三是做数据交易以及相关衍生的产业,是创业公司相对容易进入的领域。
其他跟大数据相关的涉及人工智能、区块链等等需要更多创新和技术门槛的领域,目前还在前期投入阶段,短期内盈利较难。
在他看来,在数据交易领域,相应的数据标准化以及法律规范还比较滞后,统计类的数据价值较低,真正有用的数据比如个人隐私数据、征信数据,对精准营销和个人信贷都是有商业价值的。
从2014年到2017年,大数据创业经历了蜂拥而上到野蛮生长,再到行业规范出台的洗牌阶段,大数据公司优势明显,有技术创业的公司也将凸显优势。
陈新河调研过上百家大数据公司,在他看来目前国内的BAT类的知名互联网公司,也就是目前数据量较大的大数据公司,在数据隐私保护和法律方面很注意规范。比如某大数据创业公司,在买入外部数据方面就很谨慎,首先数据要通过法务的审核和把控,防止“污染内部数据”,会关注买入数据的数据源的合法合规性问题。
陈新河不认为大数据公司估值降低跟行业规范有必然关系,2014年和2015年国内包括互联网、大数据领域的创业都是资本狂热期,市场上的钱比较多,创业公司高估值是正常现象,2016年下半年开始创投资本也都更理性,也有人说进入资本寒冬。到2017年,资本市场急剧降温,同时一些大数据公司的业绩并没有达到投资人的预期,估值下降、裁员收缩规模在所难免。
在他看来,即使没有相关法律出台以及传闻风波,创业公司估值趋向理性都是必然的,只是系列事件会加速行业洗牌,不管是企业还是投资方也都会更谨慎。
数据业“去杠杆”
近三年,大数据的风一直在吹,风口去泡沫化在2016年已经开始。
以北京某金融类大数据公司为例,2015年公司估值15亿元人民币,创始人没有卖,2016年初的估值已经降到10个亿,年底做价5个亿依然没有卖掉。“现在3亿多都没人要,公司正在裁员,养不起,一个技术人员一个月要三四万。”这家公司副总表示后悔。
记者熟悉的另一家北京大数据公司,2015年估值20亿元人民币,现在不到10个亿,估值下降的原因之一就是,数据交易在这家公司业务中占比较高。
陈新河不认为大数据公司估值降低跟行业规范有必然关系,2014年和2015年互联网、大数据领域的创业赶上资本狂热期,市场上的钱比较多,创业公司高估值是正常现象,2016年下半年开始,创投资本更加理性。到2017年,经过一个小周期,很多人发现前几年投的公司并没有带来回报,自然对这类公司的预期就降低了。
在他看来,即使没有相关法律出台以及传闻风波,创业公司估值趋向理性都是必然的,只是系列事件会加速行业洗牌,不管是企业还是投资方也都会更谨慎。
武汉的一家医疗大数据公司雕龙数据创始人罗斌则不以为然,他的公司刚获定增6875万,他认为自己的公司比2016年更值钱,因为公司的营收增长很快,其业务不涉及到数据交易,主营业务是为医疗卫生行业提供基于医疗大数据智能分析的决策支持系统,为医疗大数据的交互、共享应用服务提供解决方案等,不涉及所谓的用户数据隐私相关的法律风险。
从大数据公司跳出来创业的武源文认为,大数据领域的创业到了一个新阶段。他现在的创业方向是区块链。
武源文给21世纪经济报道记者介绍了他的新创业项目,对区块链技术与大数据的结合创新充满期待。他认为,区块链技术将会在数据来源、数据归属、数据真实性、数据不可篡改性等方面取得重大突破。
从一个风口到另一个风口,创业者们前赴后继。陈新河告诉21世纪经济报道记者,按照工信部大数据产业规划的预测,到2020年,中国大数据产业达到1万亿元,目前,大数据产业仍处于非常早期的阶段,如同20年前的软件产业所处的阶段,未来想象空间非常大,但在发展过程中,势必经历从不成熟到成熟,从野蛮迈向规范,从泡沫回归理性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22