京公网安备 11010802034615号
经营许可证编号:京B2-20210330
中国的IT基础不完善影响大数据使用
“中国在大数据方面所具有的优势是规模,可收集上亿的数据,这很难被超越。但中国企业的问题在于近几年发展得过快,因而来不及完善IT业的基础设施。”在10月25~26日的2014年浦江创新论坛上,《大数据时代》作者、牛津大学教授维克托·迈尔·舍恩伯格(Viktor Mayer-Schonberger)接受《第一财经日报》记者采访时如此描述中国在大数据时代下的现存问题。
在舍恩伯格看来,基础设施的不完善就意味着无法全面收集和处理数据。因此他建议,中国应在IT基础设施建设、鼓励数据抓取和处理领域投入更多。“明天就可以开始投入,而这种投入没有终点,需要不断完善。”舍恩伯格对《第一财经日报》记者表示。
《经济学人》曾将舍恩伯格定义为大数据领域最受人尊敬的权威发言人之一,因为《大数据时代》一书而在中国风靡的舍恩伯格明确提出了大数据时代的转变。他指出,大数据时代,相关关系比因果关系更重要,即需要知道“是什么”,而非“为什么”。
在本次浦江创新论坛上,舍恩伯格表示,大数据就像是个冰山,浮出水面的只是冰山一角,真正的价值在于水下的巨大部分。挖掘和了解水下的冰山需要反复利用大数据并不断地分析处理以得出有力的结论。
演讲过后,舍恩伯格接受了包括《第一财经日报》在内的中国媒体的采访。在他看来,“大数据的魅力就在于,未来创建公司并不取决于你有多少资金,而是你有多好的创意”。对于下一代的年轻人而言,最需要接受的教育并不是大数据如何分析,而是学习大数据的思维,懂得通过大数据来更好地观察和认识这个世界。一旦能读懂大数据背后的价值,就能找到无限的创新机遇。
大数据时代创业取决于创意
日报:对于年轻的创业者而言,大数据有何益处?
舍恩伯格:大数据最显著的作用在于它让创业的成本越来越小。想象一下,100年前你要建一个工厂,这是多么昂贵的事。但现在创立一个公司可能只需要几千美元的启动资金。如今的创业不需要建立一个厂房,也不需要大量的资金,因为电脑或办公用地都可以租用。
因此,大数据的魅力就在于,现在和未来创建公司并不取决于你有多少资金,而是你有多好的创意。未来我们一定会看到大量拥有创意的年轻创业者的涌现。
日报:上海市政府正在开放大数据,并和企业合作开发大数据的分析产品,你对此有何建议?
舍恩伯格:开放数据是政府大数据策略中的重要因素。因为它不仅仅通过开放了数据以提升社会的公共服务,还刺激了经济的增长,促进了大数据竞争中初创企业的成长。因此,我为上海市政府的这一作为鼓掌,开放数据还将催生更多与数据处理和应用相关的公司和经济。
提到建议,我们在美国和英国所见证的是,这些国家的政府已经开放了数据,但单纯公开还不足够。政府需要建立经济中心或机构去处理和分析数据,以实现大数据的应用。不加以分析和处理的数据只是数据,无人问津,政府还需要帮助企业和个人找到数据的利用价值。
另外,对于企业,我建议,不要只将数据应用在市场分析上,而是要真正创造出新的产品和新视角。
举个例子,在美国调查超市里最好卖的馅饼(Pie)是什么,每个人都回答说是苹果派。看起来美国人最喜欢苹果派。但通过对大数据分析,调查人员发现,如果超市改变了馅饼的大小,那样一个家庭就不需要买一整个大的馅饼,而是可以选择两三个小一点的馅饼,突然间,最好卖的派就不再是苹果派了,人们会选择不同种类的派。所以,现实是,美国人并非最喜欢苹果派。因此,通过对大数据的分析,可以得出更多复杂的细节,也可以找到市场中微小的商机。对于社会而言,大数据也会告诉你这个社会的多元和复杂性,但也可从中找到盈利点。
大数据的使用瓶颈在于分析工具
日报:中国政府和企业目前使用大数据的情况存在哪些问题?
舍恩伯格:我对于中国使用大数据的现状印象深刻。中国在大数据方面所具有的优势是规模,中国可以收集到几亿的数据,这很难被超越。但中国企业的问题在于近几年发展得过快,因而来不及完善IT业的基础设施。基础设施不完善就意味着无法收集和处理全面的数据。
对比发展相对缓慢的德国,企业和IT基础设施一起发展,因此就可以及时捕捉大数据。也就是说,德国比中国有更好的利用大数据的基础。建议中国未来在数据捕捉或处理的基础设施建设上更多投入。这种投入没有终点,需要不断完善。
日报:你认为大数据发展有哪些瓶颈?
舍恩伯格:从技术上来说,主要是分析工具。以前的分析工具主要是用于分析小范围内的数据,现在需要适用于大数据的分析工具。目前有很多大学正在研究。
大数据应用的挑战还在于理念。要充分认识到大数据的预测作用,从而可以反复利用数据带来的价值。因此对于年轻人和儿童而言,最需要接受的教育并不是数据如何分析,而是如何通过大数据来观察和认识这个世界。就像看到这个房间时看到的不只是沙发和桌子,还有室内能源消耗从而影响气候的数据等。
可以说,人们尚未建立对大数据影响的普遍认识是大数据发展的最大瓶颈。
如今谷歌正在创立无人驾驶的汽车公司。但谷歌是最擅长收集汽车驾驶情况和交通环境等各种数据的公司。未来的汽车公司也不再是传统的汽车生产型公司,而是可以提供可利用的数据来创造商机的服务型公司。
大数据时代需要新的隐私保护法
日报:有竞争的企业不愿共享信息这一问题如何解决?
舍恩伯格:有竞争关系的大公司的确不可能共享信息。这中间就存在巨大的商机,会催生新创立的小公司来做中间的连接。显然,美国各大航空公司不会合作建一个网站,发布它们的机票价格信息。这就出现了一家做机票打折信息服务的小企业,它分别与航空公司洽谈,每月支付一定的数据使用费来获取机票的价格来提供给乘客,从而让双方受益。
日报:在大数据时代,如何保护用户的隐私?
舍恩伯格:没有信任就没有大数据。政府的职责是要去建立使用大数据的法律法规以保护用户的隐私。
欧美现在面临的问题是,原先对于隐私的保护法规条例并不适用现在的大数据时代。我们非常需要一个全新的机制来保护个人隐私。新的机制不应该再是去询问用户愿不愿意分享这一数据,因为很多用户没有看条款就点击“同意”了。大数据时代需要法律法规来规定,基于怎样目的的数据可以被利用,哪些又不能被使用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26