京公网安备 11010802034615号
经营许可证编号:京B2-20210330
中国的IT基础不完善影响大数据使用
“中国在大数据方面所具有的优势是规模,可收集上亿的数据,这很难被超越。但中国企业的问题在于近几年发展得过快,因而来不及完善IT业的基础设施。”在10月25~26日的2014年浦江创新论坛上,《大数据时代》作者、牛津大学教授维克托·迈尔·舍恩伯格(Viktor Mayer-Schonberger)接受《第一财经日报》记者采访时如此描述中国在大数据时代下的现存问题。
在舍恩伯格看来,基础设施的不完善就意味着无法全面收集和处理数据。因此他建议,中国应在IT基础设施建设、鼓励数据抓取和处理领域投入更多。“明天就可以开始投入,而这种投入没有终点,需要不断完善。”舍恩伯格对《第一财经日报》记者表示。
《经济学人》曾将舍恩伯格定义为大数据领域最受人尊敬的权威发言人之一,因为《大数据时代》一书而在中国风靡的舍恩伯格明确提出了大数据时代的转变。他指出,大数据时代,相关关系比因果关系更重要,即需要知道“是什么”,而非“为什么”。
在本次浦江创新论坛上,舍恩伯格表示,大数据就像是个冰山,浮出水面的只是冰山一角,真正的价值在于水下的巨大部分。挖掘和了解水下的冰山需要反复利用大数据并不断地分析处理以得出有力的结论。
演讲过后,舍恩伯格接受了包括《第一财经日报》在内的中国媒体的采访。在他看来,“大数据的魅力就在于,未来创建公司并不取决于你有多少资金,而是你有多好的创意”。对于下一代的年轻人而言,最需要接受的教育并不是大数据如何分析,而是学习大数据的思维,懂得通过大数据来更好地观察和认识这个世界。一旦能读懂大数据背后的价值,就能找到无限的创新机遇。
大数据时代创业取决于创意
日报:对于年轻的创业者而言,大数据有何益处?
舍恩伯格:大数据最显著的作用在于它让创业的成本越来越小。想象一下,100年前你要建一个工厂,这是多么昂贵的事。但现在创立一个公司可能只需要几千美元的启动资金。如今的创业不需要建立一个厂房,也不需要大量的资金,因为电脑或办公用地都可以租用。
因此,大数据的魅力就在于,现在和未来创建公司并不取决于你有多少资金,而是你有多好的创意。未来我们一定会看到大量拥有创意的年轻创业者的涌现。
日报:上海市政府正在开放大数据,并和企业合作开发大数据的分析产品,你对此有何建议?
舍恩伯格:开放数据是政府大数据策略中的重要因素。因为它不仅仅通过开放了数据以提升社会的公共服务,还刺激了经济的增长,促进了大数据竞争中初创企业的成长。因此,我为上海市政府的这一作为鼓掌,开放数据还将催生更多与数据处理和应用相关的公司和经济。
提到建议,我们在美国和英国所见证的是,这些国家的政府已经开放了数据,但单纯公开还不足够。政府需要建立经济中心或机构去处理和分析数据,以实现大数据的应用。不加以分析和处理的数据只是数据,无人问津,政府还需要帮助企业和个人找到数据的利用价值。
另外,对于企业,我建议,不要只将数据应用在市场分析上,而是要真正创造出新的产品和新视角。
举个例子,在美国调查超市里最好卖的馅饼(Pie)是什么,每个人都回答说是苹果派。看起来美国人最喜欢苹果派。但通过对大数据分析,调查人员发现,如果超市改变了馅饼的大小,那样一个家庭就不需要买一整个大的馅饼,而是可以选择两三个小一点的馅饼,突然间,最好卖的派就不再是苹果派了,人们会选择不同种类的派。所以,现实是,美国人并非最喜欢苹果派。因此,通过对大数据的分析,可以得出更多复杂的细节,也可以找到市场中微小的商机。对于社会而言,大数据也会告诉你这个社会的多元和复杂性,但也可从中找到盈利点。
大数据的使用瓶颈在于分析工具
日报:中国政府和企业目前使用大数据的情况存在哪些问题?
舍恩伯格:我对于中国使用大数据的现状印象深刻。中国在大数据方面所具有的优势是规模,中国可以收集到几亿的数据,这很难被超越。但中国企业的问题在于近几年发展得过快,因而来不及完善IT业的基础设施。基础设施不完善就意味着无法收集和处理全面的数据。
对比发展相对缓慢的德国,企业和IT基础设施一起发展,因此就可以及时捕捉大数据。也就是说,德国比中国有更好的利用大数据的基础。建议中国未来在数据捕捉或处理的基础设施建设上更多投入。这种投入没有终点,需要不断完善。
日报:你认为大数据发展有哪些瓶颈?
舍恩伯格:从技术上来说,主要是分析工具。以前的分析工具主要是用于分析小范围内的数据,现在需要适用于大数据的分析工具。目前有很多大学正在研究。
大数据应用的挑战还在于理念。要充分认识到大数据的预测作用,从而可以反复利用数据带来的价值。因此对于年轻人和儿童而言,最需要接受的教育并不是数据如何分析,而是如何通过大数据来观察和认识这个世界。就像看到这个房间时看到的不只是沙发和桌子,还有室内能源消耗从而影响气候的数据等。
可以说,人们尚未建立对大数据影响的普遍认识是大数据发展的最大瓶颈。
如今谷歌正在创立无人驾驶的汽车公司。但谷歌是最擅长收集汽车驾驶情况和交通环境等各种数据的公司。未来的汽车公司也不再是传统的汽车生产型公司,而是可以提供可利用的数据来创造商机的服务型公司。
大数据时代需要新的隐私保护法
日报:有竞争的企业不愿共享信息这一问题如何解决?
舍恩伯格:有竞争关系的大公司的确不可能共享信息。这中间就存在巨大的商机,会催生新创立的小公司来做中间的连接。显然,美国各大航空公司不会合作建一个网站,发布它们的机票价格信息。这就出现了一家做机票打折信息服务的小企业,它分别与航空公司洽谈,每月支付一定的数据使用费来获取机票的价格来提供给乘客,从而让双方受益。
日报:在大数据时代,如何保护用户的隐私?
舍恩伯格:没有信任就没有大数据。政府的职责是要去建立使用大数据的法律法规以保护用户的隐私。
欧美现在面临的问题是,原先对于隐私的保护法规条例并不适用现在的大数据时代。我们非常需要一个全新的机制来保护个人隐私。新的机制不应该再是去询问用户愿不愿意分享这一数据,因为很多用户没有看条款就点击“同意”了。大数据时代需要法律法规来规定,基于怎样目的的数据可以被利用,哪些又不能被使用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25