京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据发展需要“破冰强基”
大数据正在深刻地改变着经济社会生活的方方面面。然而,这一互联网新技术,眼下却遭遇数据难以共享等诸多困难,数据的公信度和共识性因此打折。同时,大数据在应用、交易、法律环境等方面也面临着不少制度性难题。
“高热”之下有“冰点”
盘点当下的高热词,“大数据”是其中之一。但业内专家担忧,“高热”下掩盖着“冰点”,这些“冰点”将阻碍刚刚起步的我国大数据产业的健康成长。
【“冰点”一:大数据应用不足】
阿里巴巴集团副总裁、数据委员会会长车品觉认为,目前,大数据行业最突出的问题是“只见树木,不见森林”。移动互联网、电商等是“重用”大数据的重点领域,而大部分传统企业对此却缺乏意识,甚至还不清楚如何利用数据。
同时,大数据应用的深度也远远不够。“国内的不少企业仅是利用大数据模型做营销方案,而像谷歌、亚马逊等国际知名企业,已将大数据思维全面融入公司管理。”车品觉说。
【“冰点”二:“找不到数据”】
找不到数据是数据应用企业面临的普遍困扰。海尔家电产业集团营销总经理宋照伟直言,海尔希望获知用户的多维度行为习惯,但能够掌握的信息渠道仍然狭窄,信息量不够理想。
“拿走数据的多,贡献数据的少。”贵阳大数据交易所执行总裁王叁寿表示,不少企业以保护商业机密或节省数据整理成本等为理由,不愿意交易自身数据。
【“冰点”三:商业数据“割据”,政府数据“孤立”】
以阿里巴巴旗下的“芝麻信用”为例,其评分依据的数据只来自支付宝平台,本身公信力有限,而其他企业希望能利用支付宝相关数据时,又很难获得。
同样,政府数据公开程度也非常有限。比如,银行在为客户办理信贷业务时,只能查到其在当地的工商信息,无法获知其在外地的情况。
【“冰点”四:侵权还是“个性化推荐”存争议】
对于个人数据隐私保护、数据权属、政府数据公开等问题,目前尚无明确的规定,因此,纠纷时有发生。
以朱烨诉百度侵权案为例,2015年,网民朱烨发现自己用百度搜索关键词后会收到相关广告推送,因此将百度以侵犯隐私权为由告上法庭。法院一审认定百度侵犯朱烨隐私权,但二审却撤销一审判决。中国政法大学传播法中心研究员朱巍表示,两级法院给出截然相反的判决,说明法律界对此类新情况认识不一致。
三大基础性“缺陷”待弥补
专家从三个方面分析了产生上述问题的原因,并认为这是我国大数据产业发展必须加快弥补的三大基础性“缺陷”。
【“缺陷”一:产业信息化尚未完成】
IBM大中华区大数据与分析部数据分析产品线主管洪建勋研究发现,目前国内大量客户还停留在将80%的时间用在数据获取上,还缺乏系统化整理,更谈不上“商务智能”应用了。这和企业信息化水平较低有直接关系。
中国社会科学院信息化研究中心秘书长姜奇平表示,信息化是大数据的基础,而信息化的推进都是先从消费者开始,然后才传导到企业和政府。农业、工业、能源等行业的数据化还需假以时日。
【“缺陷”二:“大数据思维”未成行业共识】
车品觉表示,现在企业大多将大数据作为工具,导致“要数据的不知道大数据从哪里来,做数据的不知道大数据如何用,用数据的人担心真实性不敢用”。
也正是因为“大数据思维”未能达成共识,数据互惠共利的环境难以形成,推动数据共享就比较艰难。
【“缺陷”三:监管和立法滞后】
大数据产业发展之快难以想象,但对于数据权属、个人数据隐私、政府数据公开等,目前都缺乏具有针对性的法律法规。而且,大数据作为新型资源,目前还没有明确专门的监管部门。
朱巍介绍,现在对个人数据的保护,大多依照2012年通过的“关于加强网络信息保护的决定”,这已远远不能适应目前行业的发展现状。
在加快发展中走出“成长烦恼期”
业内人士认为,我国大数据产业在目前乃至较长一段时间或都处于“成长烦恼期”。因此,要在加快发展中探索成长之路。
从规模上看,2015年我国大数据市场仅有102亿元,不及一家股份制银行一年的净利润。而在国内以及境外的资本市场上,还没有出现中国的大数据行业巨头。
关于大数据应用问题,清华大学数据科学研究院执行副院长韩亦舜表示,随着社会信息化程度加深,数据源将更加丰富,大数据应用范围将不断扩大。
对于大数据共享的困境,业内专家指出,这在全球都是一个难题。目前,我国正探索建立大数据交易所,以交易驱动数据共享;有的行业内部已经形成企业间互换数据的惯例。
另外,可以借鉴国外经验,对政府数据进行更好的挖掘、利用,如将非涉密的政府数据放在网上,供社会查阅。
在大数据立法与监管层面,业内人士建议,应确定监管部门,并完善相关立法,加紧制定有关大数据的标准、规则、指引,引导行业规范发展。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23