京公网安备 11010802034615号
经营许可证编号:京B2-20210330
发展大数据最大瓶颈是人才
日前在京举办的“中国国际大数据大会”上,中科院院士、北京大学教授鄂维南表示,中国大数据的前景非常广阔,市场非常大。但如何把这个广阔的前景变成现实,现在还面临数据质量不高、数据流通不畅、数据分析存技术问题等诸多瓶颈,“但最严重的还是人才问题”。
鄂维南指出,我国理论上说有很多数据,但当前存在“数据孤岛”现象,不同部门数据存储于不同的地方,格式也不一样,整合比较难。“大数据最高的层次就是要用数据来形成智慧,使得社会各方面可以运转起来。因此,做数据分析先要整合数据。”
“数据的质量也是一个瓶颈”,鄂维南强调,但这并不是说我们要有很完美的数据才能做分析,完美的数据永远是等不来的,做数据分析的出发点是有多少数据可以做多少事。“此外,数据的拥有方,像电信、联通,和数据分析者中间有一个很大的鸿沟,双方存在沟通障碍。”
那么,怎样才能够让数据流通起来?鄂维南介绍,目前大家想到的是数据开放,现在政府也在呼吁开放,但数据开放面临严重的隐私问题。严格来说,想靠法律办法解决隐私问题并不可能,这是数据开放面临的现实问题。
另外,现在还存在这样一种情况:即数据拥有方习惯于自己建一个团队自己来做数据分析,但实际上数据分析是一个技术活。“现在我们的大数据分析公司风起云涌,什么人都可以做,没有什么技术含量,但是长远来说这条路走不通。我觉得数据行业服务最重要的是提高门槛。”鄂维南说。
“技术问题也是瓶颈。数据分析本身就是一个难题,另外中国的数据有它自身特色。”鄂维南说,从文本分析来看,我们用中文,美国用英文,两者的文本并不一样,不能完全套用国外模式。此外,我国的数据质量比较差,这个时候就需要对算法和模型进行改进。同时,数据服务作为一个业务模式,其商业模式还没有真正被认可,“数据通过什么方式赚钱,前景还不是那么清楚”。
“当然,最严重的问题是人才问题”,鄂维南指出,我国大数据发展最大的优势是市场大,最大的劣势是缺乏人才。由于大数据产业的火热,目前即使在国外,学术界跟企业界之间的人才竞争也非常激烈,在国内同样如此。并且我国目前没有非常好的培养大数据人才的机制。“本来我国教育界、科技界的人才就缺乏,而在大数据领域,统计、机械学习等相比而言更弱,所以这个问题需要引起重视。”鄂维南说。
“我个人的感觉是,我国大数据市场非常大,但要真正落到实处,要做的事情还非常多。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26