京公网安备 11010802034615号
经营许可证编号:京B2-20210330
75.9%受访者发现存在“大数据”滥用现象
电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛认为,企业有没有“大数据”能力,分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身要具有一定规模,肯定不同于以前社会科学控制实验中几十几百人的规模;二是数据分析结果要能够提供深刻洞见,不是简单的统计分析,譬如“某社交网络1000万用户中45%是男性”、“全国春运最热航线是北京到上海”,这些都不是“大数据”。
近年来,从技术界走出来的“大数据”逐渐受到社会各界的高度关注,在社会管理、企业营销、青年就业创业等方面都发挥出很大作用。但到底什么是“大数据”,很多人对此还有疑惑。同时,“大数据”被迅速广泛引用也引发人们对滥用的担忧。
近日,中国青年报社会调查中心通过民意中国网和手机腾讯网对2315人进行的一项调查显示,43.6%的受访者认为“大数据”分析意义很大,但80.0%的受访者也确认自己不清楚什么是“大数据”,75.9%的受访者发现目前存在“大数据”被滥用的现象。
80.0%受访者不清楚什么是“大数据”
调查中,听说过和没听说过“大数据”的受访者各占一半。80.0%的受访者直言不清楚什么是“大数据”,表示“非常清楚”和“比较清楚”的受访者分别仅占8.3%和11.6%。
北京大学信息工程学院计算机应用技术专业研一学生卿,这学期正在学习一门关于调研“大数据”的课程。谈及如今的“大数据”热,卿显得有些激动。他说,“大数据”可以帮助人们了解平时注意不到的信息,还可以预测未来,比如可以根据机票涨降情况确定最佳购票时机,根据人们的搜索记录更早地预测流感传播。
卿表示,如今很多企业都在说“大数据”,其中不乏“跟风”现象。有些数据分析贴上“大数据”标签,瞬间就显得“高大上”,其实并没有真正的“大数据”分析。
统计学专业毕业的王京也认为,现在有些标榜“大数据”的报告,一方面数据量不大,另一方面也不是“大数据”的思维。“大数据”讲究效率、针对个人,但很多类似于“大数据教你谈恋爱”这样的说法,更多是一种噱头。
调查中,75.9%的受访者发现“大数据”存在被滥用的现象。
电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛说,的确有一些企业在商务智能时代没有学好商务智能,到了大数据时代才刚刚学会商务智能,就说自己是“大数据”。
周涛认为,一个企业有没有“大数据”能力,一个分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身要具有一定规模,肯定不同于以前社会科学控制实验中几十几百人的规模;二是数据分析结果要能够提供深刻洞见,不是简单的统计分析,譬如“某社交网络1000万用户中45%是男性”、“全国春运最热航线是北京到上海”,这些都不是“大数据”,只是非常简单的分析方法在稍微大一点的数据集上的应用。举个例子,通过分析春运人口迁移路线、迁移方式(体现了经济水平)以及购票人的身份证信息(体现了年龄和籍贯),来对中国劳动人口的流动现状进行刻画,并对未来中国劳动力流动与分布形态进行预测,这就有一点“大数据”的影子了。
王京觉得,我们的传统比较偏重人文主义、缺乏数据思维,这些“大数据”的说法虽然存在问题,在专业性上过不了关,但对于推广数据化思维、养成用数据说话的观念是有意义的。
35.6%受访者觉得一些“大数据”分析空有大量数据
南京大学计算机专业博士高坤(化名)说,现在“大数据”还存在很多问题,比如数据的所有权问题、隐私问题、安全问题等,都需要尽快解决。
周涛认为,很多人分不清安全和隐私。安全问题一直都有,主要是指攻击方通过一些手段盗取信息或破坏信息。使用数据的企业,在接触敏感甚至涉密信息时,应该有安全资质的认证。这在我国的运营商体系和金融体系里都有明确要求。
“经常和安全问题混为一谈的,是数据隐私的问题。”周涛说,一方面,隐私数据直接泄露,或者有不法人士售卖这些信息,另一方面,一些隐私信息通过技术手段遭到破译。这样就可能给个人或商家带来伤害,比如一些招聘网站的个人求职信息被破译之后,会对个人造成伤害,也会让招聘企业无法阻断信息,失去盈利空间。
“除去法律层面、道德层面,科学技术层面上也还有很多问题需要解决。”高坤说,有这么多数据,具体怎么处理,还需要更好地研究。现在很多“大数据”只是存储下来,缺少进一步分析,但是把海量数据存储下来本身也是技术进步,是“大数据”工作的一部分。
王京说,一方面,没有有效的方法来分析数据,另一方面,很多平台没有打通,比如说一个人上网不只买东西,还会聊天,聊天对买东西是有影响的,但是聊天的数据和买东西的数据无法对接起来,无法产生商业价值。
调查中,35.6%的受访者觉得现在一些“大数据”分析空有大量数据,30.8%的受访者认为缺乏数据安全,11.1%的受访者提出缺乏科学性,9.3%的受访者指出分散数据没有有效整合,7.8%的受访者认为存在“大数据”与传统分析概念混淆的情况。
43.6%受访者认为“大数据”分析意义很大
调查显示,43.6%的受访者认为“大数据”分析的意义很大,7.0%的受访者认为不太大,9.5%的受访者觉得“大数据”分析没什么意义,39.8%的受访者表示不好说。
90后北大研究生刘环是在一次讲座上了解到了“大数据”。刘环认为,“大数据”确实还存在很多问题,但不可否认生活、学习中的很多细节也因“大数据”而改变,比如现在用的翻译工具越来越智能化,一些输入法更人性化,这些都归功于“大数据”分析,相信“大数据”会有更大发展空间。
王京说,虽然“大数据”现在还在试验、探索阶段,但是“大数据”很重要,跟我们每个人生活都息息相关。原来的数据生产是由专业机构去做,现在我们每天都在生产数据,只要有媒介的地方就会产生数据。“数据科学家的文本分析、行为分析,都是能带来价值的,比如现在的微博、微信等,通过数据分析就能带来商业价值”。
周涛表示,“大数据”分析的意义主要体现在:一、挖掘数据中潜藏的关联关系甚至因果关系;二、对数据整体中缺失的信息进行预测;三、对数据所代表的系统走势进行预测;四、支持对数据所在系统功能的优化,或者对决策起到评估和支撑作用。
高坤认为,“大数据”本身是一种新的科学手段,虽然目前还不成熟,但已经开始受到科学家的关注。“大数据”对于经济、国防,都是最重要的科技手段。青年应该更多地关注科学技术的发展,从科技的角度来理解“大数据”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11在CDA(Certified Data Analyst)数据分析师的实操体系中,统计基本概念是不可或缺的核心根基,更是连接原始数据与业务洞察的关 ...
2026-02-11在数字经济飞速发展的今天,数据已成为核心生产要素,渗透到企业运营、民生服务、科技研发等各个领域。从个人手机里的浏览记录、 ...
2026-02-10在数据分析、实验研究中,我们经常会遇到小样本配对数据的差异检验场景——比如同一组受试者用药前后的指标对比、配对分组的两组 ...
2026-02-10在结构化数据分析领域,透视分析(Pivot Analysis)是CDA(Certified Data Analyst)数据分析师最常用、最高效的核心实操方法之 ...
2026-02-10在SQL数据库实操中,字段类型的合理设置是保证数据运算、统计准确性的基础。日常开发或数据分析时,我们常会遇到这样的问题:数 ...
2026-02-09在日常办公数据分析中,Excel数据透视表是最常用的高效工具之一——它能快速对海量数据进行分类汇总、分组统计,将杂乱无章的数 ...
2026-02-09表结构数据作为结构化数据的核心载体,其“获取-加工-使用”全流程,是CDA(Certified Data Analyst)数据分析师开展专业工作的 ...
2026-02-09在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06