京公网安备 11010802034615号
经营许可证编号:京B2-20210330
研究机构比企业更缺大数据专业人才
为了能够及时应对大数据时代带来的挑战,国内学术界最近有着不少新动静。中科院院士马志明近日就发表了这样的声明,上月他几乎每个礼拜都可以看到一家全新的、和大数据相关的研究机构或研究平台诞生。从中科院系统内部培育的重点实验室到国家基金委的“双清论坛”,再到日前上海财经大学携手国家统计局成立“大数据统计科学中心”—一个信号已经非常清晰:对大数据的深挖和系统研究,已是板上钉钉的国家性质的结构战略。
“在大数据时代,数据科学家和数据工程师非常紧缺。”根据一些机构的测算,未来5年,国内各行各业需要的大数据专业人才,缺口将高达1000万左右。
对海量数据信息的处理手段还远不够
大数据正给各行各业带来巨变。以保险业的车险为例,如果在每辆汽车上加载一个行驶监测设备,保险公司就可以轻松掌握每一个用户的车辆使用情况、个人驾驶习惯等。基于这些关键数据,保险公司就可以针对不同的用户“定制”不同的车险品种,从而提高投保的精准率。
上海财经大学统计与管理学院院长周勇教授说,无论是学术界还是企业界都已察觉,大数据是一座“富矿”,对大数据的收集、深挖过程,本身就伴随着很多的发展机会。
但开掘“富矿”并不容易。比如,对海量数据信息的处理手段,目前还远远不够。有业内人士做过测算,假设一个城市有3万个左右摄像头,在不经任何加工的情况下原始保存连续两个月的图像信息,耗资将高达上百亿元人民币。除了要解决数据存储的基础设施问题,如何从海量的图像信息中提取有效信息,也是目前学界正在加紧研究的课题。
“过去10年至15年来,基于互联网的信息技术革命已给全人类带来了颠覆性影响,信息科学从某种程度上说,已成为推动经济发展的一个重要引擎。现在还可以预见的是:在未来的几十年时间里,更多与经济社会发展相关的决策,都会被大数据推着走。”美国普林斯顿大学终身教授、上海财经大学大数据统计科学中心首席科学家范剑青教授说,对大数据的研究固然涉及众多学科、领域,但按照目前美国学术界的共同看法,数学、统计学和计算机科学的三者结合是构成分析、研究大数据的基础。
研究机构比企业更缺大数据专业人才
随着大数据时代的到来,专业数据处理人才已从“走俏”变成“紧缺”。“过去我们的毕业生一般喜欢到金融机构、保险机构等单位就业,做一些和数据分析相关的工作。但现在,互联网公司、大型药企都开出高薪抢人。”周勇说。颇有意思的是,来自企业的高薪揽才,客观上让学术界“尴尬”:“现在最需要、最缺少大数据专业人才的其实是高校和研究机构。高起点、高水平的研究亟需高层次的人才加盟,但因为科研机构的待遇不如企业,留住人才成了一桩难事。”
大数据“捧红”了作为传统学科的统计学;但另一方面,统计学受到的来自大数据的挑战,也比其他学科要猛烈得多。
“在大数据时代,很多传统的数据收集方法、统计方法显得失效,而且用统计的手段进行经济预测的功能,也出现了根本性的变革。”据介绍,国家统计局目前已经在和百度、阿里巴巴等互联网公司合作,深度开发挖掘大量实时在线的搜索数据,从而提升统计数据的准确性和及时性。过去,统计数据对经济走势预测、对宏观决策的作用往往是“用过去的经验来预测未来”,而今后,“经济雷达”在预测、预警时发挥的功效会显得更具时效性。
“有了互联网、大数据,收集信息的渠道和时效明显增强,无论是专业的统计部门还是智库,不用再为拿不到真实数据而烦恼了。”也有一位统计学专家告诉记者,虽然数据来源多样、获取渠道多样是大数据时代的“红利”,但它同时也滋生出信息安全、用户隐私权保护方面的新问题。
“学界与业界对大数据带来的变革和挑战有不同层次的关注、感受,业界有强烈的问题驱动,学界则对面临的学术任务非常明晰。”上海财经大学校长樊丽明说,上海财大此次联合国家统计局成立“大数据统计科学中心”,初衷就是聚焦国家战略,形成在大数据研究、社会经济统计等领域的合作研究项目,以学校的优势学科服务上海科创中心建设。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10