京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的成长期烦恼:四大“冰点”三大“缺陷”
大数据在深刻地改变着经济社会生活的方方面面。然而,这一互联网新技术,眼下却遭遇数据难以共享等诸多困难,数据的公信度和共识性因此打折。同时,大数据在应用、交易、法律环境等方面也面临着不少制度性难题。
“高热”之下有“冰点” 盘点当下的高热词,“大数据”是其中之一。但业内专家担忧,“高热”下掩盖着“冰点”,这些“冰点”将阻碍刚刚起步的我国大数据产业的健康成长。
“冰点”一:“只见树木,不见森林” 阿里巴巴集团副总裁、数据委员会会长车品觉认为,目前,大数据行业最突出的问题是“只见树木,不见森林”。移动互联网、电商等是“重用”大数据的重点领域,而大部分传统企业对此却缺乏意识,甚至还不清楚如何利用数据。
同时,大数据应用的深度也远远不够。“国内的不少企业仅是利用大数据模型做营销方案,而像谷歌、亚马逊等国际知名企业,已将大数据思维全面融入公司管理。”车品觉说。
“冰点”二:“拿走数据的多,贡献数据的少” 找不到数据是数据应用企业面临的普遍困扰。海尔家电产业集团营销总经理宋照伟直言,海尔希望获知用户的多维度行为习惯,但能够掌握的信息渠道仍然狭窄,信息量不够理想。
“拿走数据的多,贡献数据的少。”贵阳大数据交易所执行总裁王叁寿表示,不少企业以保护商业机密或节省数据整理成本等为理由,不愿意交易自身数据,直接导致交易所的数据量不够丰富。
“冰点”三:商业数据“割据”,政府数据“孤立” 以阿里巴巴旗下的“芝麻信用”为例,其评分依据的数据只来自支付宝平台,本身公信力有限,而其他企业希望能利用支付宝相关数据时,又很难获得。
同样,政府数据公开程度也非常有限。比如,银行在为客户办理信贷业务时,只能查到其在当地的工商信息,无法获知其在外地的情况。
“冰点”四:侵权还是“个性化推荐”存争议 对于个人数据隐私保护、数据权属、政府数据公开等问题,目前尚无明确的规定,因此,纠纷时有发生。
以朱烨诉百度侵权案为例,2015年,网民朱烨发现自己用百度搜索关键词后会收到相关广告推送,因此将百度以侵犯隐私权为由告上法庭。法院一审认定百度侵 犯朱烨隐私权,但二审却撤销一审判决。中国政法大学传播法中心研究员朱巍表示,两级法院给出截然相反的判决,说明法律界对此类新情况认识不一致。
三大基础性“缺陷”待弥补 专家从三个方面分析了产生上述问题的原因,并认为这是我国大数据产业发展必须加快弥补的三大基础性“缺陷”。
“缺陷”一:产业信息化尚未完成 IBM大中华区大数据与分析部数据分析产品线主管洪建勋研究发现,目前国内大量客户还停留在将80%的时间用在数据获取上,还缺乏系统化整理,更谈不上“商务智能”应用了。这和企业信息化水平较低有直接关系。
洪建勋介绍,兴于上世纪末发达国家的“商务智能”管理,即“用数据说话”,这种管理方式的普及大大提升了信息化意识和水平。
中国社会科学院信息化研究中心秘书长姜奇平表示,信息化是大数据的基础,而信息化的推进都是先从消费者开始,然后才传导到企业和政府。农业、工业、能源等行业的数据化还需假以时日。
“缺陷”二:“大数据思维”未成行业共识 车品觉表示,现在企业大多将大数据作为工具,导致“要数据的不知道大数据从哪里来,做数据的不知道大数据如何用,用数据的人担心真实性不敢用”。
也正是因为“大数据思维”未能达成共识,数据互惠共利的环境难以形成,推动数据共享就比较艰难。
“缺陷”三:监管和立法滞后 大数据产业发展之快难以想象,但对于数据权属、个人数据隐私、政府数据公开等,目前都缺乏具有针对性的法律法规。而且,大数据作为新型资源,目前还没有明确专门的监管部门。
“企业和政府收集的数据拿来交易,这个数据究竟是谁的?比如政府收集了企业的数据,那么这些数据是企业的还是政府的?国家鼓励数据交易,但在法律方面要进一步明确,让行业发展有法律依据。”王叁寿说。
朱巍介绍,现在对个人数据的保护,大多依照2012年通过的“关于加强网络信息保护的决定”,这已远远不能适应目前行业的发展现状。
在加快发展中走出“成长烦恼期” 业内人士认为,我国大数据产业在目前乃至较长一段时间或都处于“成长烦恼期”,这也是大数据产业从稚嫩走向成熟的必经阶段。因此,要在加快发展中探索成长之路。
从规模上看,2015年我国大数据市场仅有102亿元,不及一家股份制银行一年的净利润。而在国内以及境外的资本市场上,还没有出现中国的大数据行业巨头。
关于大数据应用问题,清华大学数据科学研究院执行副院长韩亦舜表示,大数据产业仍在起步阶段,随着社会信息化程度加深,数据源也将更加丰富,大数据应用范围将不断扩大。
“随着经济转型升级,势必有越来越多的企业将借助大数据实现增长。”IBM大中华区大数据与分析部大数据与分析业务技术总监刘胜利表示。
对于大数据共享的困境,业内专家指出,这在全球都是一个难题。目前,我国正探索建立大数据交易所,以交易驱动数据共享;有的行业内部已经形成企业间互换数 据的惯例,如我国参与的国际间卫星数据交换交易、移动互联网公司间的数据互换等。春节期间,微信支付、支付宝、百度钱包等联手诸多商家推出促销活动,本质 上也是一种数据互换、互惠共利。
另外,可以借鉴国外经验,对政府数据进行更好的挖掘、利用,如将非涉密的政府数据放在网上,供社会查阅。
在大数据立法与监管层面,业内人士建议,应确定监管部门,并完善相关立法。在立法短时间内难以完成的情况下,应加紧制定有关大数据的标准、规则、指引,引导行业规范发展,加强隐私保护,促进政府数据开放。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25