
75.9%受访者发现存在“大数据”滥用现象
电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛认为,企业有没有“大数据”能力,分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身要具有一定规模,肯定不同于以前社会科学控制实验中几十几百人的规模;二是数据分析结果要能够提供深刻洞见,不是简单的统计分析,譬如“某社交网络1000万用户中45%是男性”、“全国春运最热航线是北京到上海”,这些都不是“大数据”。
近年来,从技术界走出来的“大数据”逐渐受到社会各界的高度关注,在社会管理、企业营销、青年就业创业等方面都发挥出很大作用。但到底什么是“大数据”,很多人对此还有疑惑。同时,“大数据”被迅速广泛引用也引发人们对滥用的担忧。
近日,中国青年报社会调查中心通过民意中国网和手机腾讯网对2315人进行的一项调查显示,43.6%的受访者认为“大数据”分析意义很大,但80.0%的受访者也确认自己不清楚什么是“大数据”,75.9%的受访者发现目前存在“大数据”被滥用的现象。
80.0%受访者不清楚什么是“大数据”
调查中,听说过和没听说过“大数据”的受访者各占一半。80.0%的受访者直言不清楚什么是“大数据”,表示“非常清楚”和“比较清楚”的受访者分别仅占8.3%和11.6%。
北京大学信息工程学院计算机应用技术专业研一学生卿,这学期正在学习一门关于调研“大数据”的课程。谈及如今的“大数据”热,卿显得有些激动。他说,“大数据”可以帮助人们了解平时注意不到的信息,还可以预测未来,比如可以根据机票涨降情况确定最佳购票时机,根据人们的搜索记录更早地预测流感传播。
卿表示,如今很多企业都在说“大数据”,其中不乏“跟风”现象。有些数据分析贴上“大数据”标签,瞬间就显得“高大上”,其实并没有真正的“大数据”分析。
统计学专业毕业的王京也认为,现在有些标榜“大数据”的报告,一方面数据量不大,另一方面也不是“大数据”的思维。“大数据”讲究效率、针对个人,但很多类似于“大数据教你谈恋爱”这样的说法,更多是一种噱头。
调查中,75.9%的受访者发现“大数据”存在被滥用的现象。
电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛说,的确有一些企业在商务智能时代没有学好商务智能,到了大数据时代才刚刚学会商务智能,就说自己是“大数据”。
周涛认为,一个企业有没有“大数据”能力,一个分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身要具有一定规模,肯定不同于以前社会科学控制实验中几十几百人的规模;二是数据分析结果要能够提供深刻洞见,不是简单的统计分析,譬如“某社交网络1000万用户中45%是男性”、“全国春运最热航线是北京到上海”,这些都不是“大数据”,只是非常简单的分析方法在稍微大一点的数据集上的应用。举个例子,通过分析春运人口迁移路线、迁移方式(体现了经济水平)以及购票人的身份证信息(体现了年龄和籍贯),来对中国劳动人口的流动现状进行刻画,并对未来中国劳动力流动与分布形态进行预测,这就有一点“大数据”的影子了。
王京觉得,我们的传统比较偏重人文主义、缺乏数据思维,这些“大数据”的说法虽然存在问题,在专业性上过不了关,但对于推广数据化思维、养成用数据说话的观念是有意义的。
35.6%受访者觉得一些“大数据”分析空有大量数据
南京大学计算机专业博士高坤(化名)说,现在“大数据”还存在很多问题,比如数据的所有权问题、隐私问题、安全问题等,都需要尽快解决。
周涛认为,很多人分不清安全和隐私。安全问题一直都有,主要是指攻击方通过一些手段盗取信息或破坏信息。使用数据的企业,在接触敏感甚至涉密信息时,应该有安全资质的认证。这在我国的运营商体系和金融体系里都有明确要求。
“经常和安全问题混为一谈的,是数据隐私的问题。”周涛说,一方面,隐私数据直接泄露,或者有不法人士售卖这些信息,另一方面,一些隐私信息通过技术手段遭到破译。这样就可能给个人或商家带来伤害,比如一些招聘网站的个人求职信息被破译之后,会对个人造成伤害,也会让招聘企业无法阻断信息,失去盈利空间。
“除去法律层面、道德层面,科学技术层面上也还有很多问题需要解决。”高坤说,有这么多数据,具体怎么处理,还需要更好地研究。现在很多“大数据”只是存储下来,缺少进一步分析,但是把海量数据存储下来本身也是技术进步,是“大数据”工作的一部分。
王京说,一方面,没有有效的方法来分析数据,另一方面,很多平台没有打通,比如说一个人上网不只买东西,还会聊天,聊天对买东西是有影响的,但是聊天的数据和买东西的数据无法对接起来,无法产生商业价值。
调查中,35.6%的受访者觉得现在一些“大数据”分析空有大量数据,30.8%的受访者认为缺乏数据安全,11.1%的受访者提出缺乏科学性,9.3%的受访者指出分散数据没有有效整合,7.8%的受访者认为存在“大数据”与传统分析概念混淆的情况。
43.6%受访者认为“大数据”分析意义很大
调查显示,43.6%的受访者认为“大数据”分析的意义很大,7.0%的受访者认为不太大,9.5%的受访者觉得“大数据”分析没什么意义,39.8%的受访者表示不好说。
90后北大研究生刘环是在一次讲座上了解到了“大数据”。刘环认为,“大数据”确实还存在很多问题,但不可否认生活、学习中的很多细节也因“大数据”而改变,比如现在用的翻译工具越来越智能化,一些输入法更人性化,这些都归功于“大数据”分析,相信“大数据”会有更大发展空间。
王京说,虽然“大数据”现在还在试验、探索阶段,但是“大数据”很重要,跟我们每个人生活都息息相关。原来的数据生产是由专业机构去做,现在我们每天都在生产数据,只要有媒介的地方就会产生数据。“数据科学家的文本分析、行为分析,都是能带来价值的,比如现在的微博、微信等,通过数据分析就能带来商业价值”。
周涛表示,“大数据”分析的意义主要体现在:一、挖掘数据中潜藏的关联关系甚至因果关系;二、对数据整体中缺失的信息进行预测;三、对数据所代表的系统走势进行预测;四、支持对数据所在系统功能的优化,或者对决策起到评估和支撑作用。
高坤认为,“大数据”本身是一种新的科学手段,虽然目前还不成熟,但已经开始受到科学家的关注。“大数据”对于经济、国防,都是最重要的科技手段。青年应该更多地关注科学技术的发展,从科技的角度来理解“大数据”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-07CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-07反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-07