
大数据:一个未知的“方程式”_数据分析师
互联网时代,各种热词、概念满天飞。说到大数据,许多人搞不太懂,甚至有人直斥“大数据=大忽悠”。大数据到底是什么,产业现状和创业机会怎样?
去年底宣布的一个事情,将对未来有深远影响,现在大家还没意识到。2013年11月19日,国家统计局与11家国内企业签署战略合作框架协议,合作内容涉及大数据应用统计标准,以及企业数据补充政府统计数据等领域。有分析称,在大数据国家战略日益强烈的情况下,统计局介入将进一步推动大数据的应用落地。
大数据绝对不是忽悠,它是当下IT领域最时髦的词,简单说就是从各种数据中快速获取价值信息的能力。美国是最早发现和使用大数据科学价值的国家。2012年3月,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略,奥巴马政府甚至将大数据定义为“未来的新石油”。当时美国政府声明说通过提高美国从大型复杂的数据集中提取知识和管理的能力,来加强整个国家的竞争力,这被认为是跟互联网同一个级别的时代。显然,大数据不止是一个词汇,更是一门技术,是一个产业时代。
而中国作为世界上人口最多、GDP排名第二的国家,成立大数据国家队是非常及时的。大数据的精髓在于“大”,它不是抽样而是全样,它不是盲人摸到的象腿或者是象鼻子,而是整个大象本身,大数据的精妙处在于用的人越多越增持,通过这样一个模糊的宏观判断,能够完成一个精准的个体推荐,从而会让整个生产效率得到极大提高。
不开放大数据,周边创业是无米之炊目前我国大数据应用还存在一些问题。首先,大数据不是IT公司的专利。第一批国家统计局引入的战略合作伙伴,大多数还是聚焦在IT公司,其实不是只有IT公司才有大数据,如线下零售巨头企业在实体经济中积累了很大的数据资源,他们数据的深度和广度不亚于甚至超过互联网公司。第一批进入的合作伙伴之一上海钢联其实掌握了煤炭钢铁在内的大宗商品数据,这是国家统计局没有涉及到的。因此,非IT类公司、拥有巨大的业务形态的企业,都可以成为第二批国家统计局大数据合作伙伴。我们也看到,国家统计局作为国家法定职能部门把姿态放平,主动寻求和民营企业的合作,这是非常可喜的进步。
第二,拥有大数据的IT公司和非IT公司应该打破数据格局。我们看BAT(百度、阿里、腾讯),近期围绕微信和淘宝发生新一轮互相屏蔽,在早前百度和淘宝进行了屏蔽,这三家掌握搜索、消费和社交的数据,本来是三方的数据汇总才能拼凑出比较完整的网上信息图谱,但是三家公司为了彼此的商业利益,并没有体现出数据合作的意愿,而是互相封杀,这将给社会数据的流动带来伤害。因此,在保证一定商业利益的基础上,巨头的眼光应该放远一点,打破数据割据。这看起来是一个很难实现的乌托邦。不过任何美好的事情都需要乌托邦的愿景作为起步的。我们看到许多美好的事情,比如说互联网,全世界的人通过互联网联结在一起,开始大家觉得乌托邦,现在已经形成现实。
第三,应该呼吁政府相关部门进一步开放市场。因为围绕大数据不管是应用还是创业,最核心的是要有数据的源头,然后才能进行采集、编辑,重新编制。据报道,现在大量的关于国民经济或者说民生的数据其实还在封闭状态,在工商部门、银行、保险、公安、医院、社保,包括电信运营商机构的手里。如何让这些数据流动起来,能让大家更方便,其实应该由政府带头实现等级制数据的开放共享。在不违反保密或者是国防的情况下,如果不开放大数据,那么相关研究和创业都是无米之炊。所以还是应该抓住这个机遇,进一步开放市场,不断试点,一步一步把数据开放转起来,带来更多的应用价值。
隐私保护与数据精准之间的平衡数据应该共融共通,还要开放市场。这个开放市场不仅仅是企业之间开放,企业对个人也要开放。为什么现在开放变得这么谨慎?因为开放有风险,一是安全问题,二是伦理问题。已经有专家指出,安全问题是对于国防、军事以及整个经济信息的保密顾虑而言;伦理问题是从个体角度而言,即网民的隐私。《大数据》作者曾经说过,在一个有组织的社会里,几乎每一则信息都在不同的时候,以不同的形式公开过。就公民而言,他的信息一次性在网上公开,和第一种情况有本质区别。
大数据平台在提供服务的同时,也在时刻收集用户的各种消费习惯、浏览习惯甚至生活习惯。如何保护用户的隐私成了大数据时代发展过程中不可回避的问题。因此,大数据的应用价值在于个人隐私保护与数据精准之间的平衡。要真正做到大数据的开放,还需要很长的路走。大数据会成为互联网之后,人类又一个技术乌托邦。大数据的启动跟互联网有着相同的逻辑,一开始大家谈,不知道怎么做,会有一轮甚至几轮比较明显的产业泡沫,但是随着那些看似乌托邦的愿景,一个技术、一个尝试的创业公司的进入,会一步一步变成现实。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-11数据透视表中两列相乘合计的实用指南 在数据分析的日常工作中,数据透视表凭借其强大的数据汇总和分析功能,成为了 Excel 用户 ...
2025-07-11尊敬的考生: 您好! 我们诚挚通知您,CDA Level I和 Level II考试大纲将于 2025年7月25日 实施重大更新。 此次更新旨在确保认 ...
2025-07-10BI 大数据分析师:连接数据与业务的价值转化者 在大数据与商业智能(Business Intelligence,简称 BI)深度融合的时代,BI ...
2025-07-10SQL 在预测分析中的应用:从数据查询到趋势预判 在数据驱动决策的时代,预测分析作为挖掘数据潜在价值的核心手段,正被广泛 ...
2025-07-10数据查询结束后:分析师的收尾工作与价值深化 在数据分析的全流程中,“query end”(查询结束)并非工作的终点,而是将数 ...
2025-07-10CDA 数据分析师考试:从报考到取证的全攻略 在数字经济蓬勃发展的今天,数据分析师已成为各行业争抢的核心人才,而 CDA(Certi ...
2025-07-09【CDA干货】单样本趋势性检验:捕捉数据背后的时间轨迹 在数据分析的版图中,单样本趋势性检验如同一位耐心的侦探,专注于从单 ...
2025-07-09year_month数据类型:时间维度的精准切片 在数据的世界里,时间是最不可或缺的维度之一,而year_month数据类型就像一把精准 ...
2025-07-09CDA 备考干货:Python 在数据分析中的核心应用与实战技巧 在 CDA 数据分析师认证考试中,Python 作为数据处理与分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的有力工具 在数据分析的广袤领域中,准确捕捉数据的趋势变化以及识别 ...
2025-07-08备战 CDA 数据分析师考试:需要多久?如何规划? CDA(Certified Data Analyst)数据分析师认证作为国内权威的数据分析能力认证 ...
2025-07-08LSTM 输出不确定的成因、影响与应对策略 长短期记忆网络(LSTM)作为循环神经网络(RNN)的一种变体,凭借独特的门控机制,在 ...
2025-07-07统计学方法在市场调研数据中的深度应用 市场调研是企业洞察市场动态、了解消费者需求的重要途径,而统计学方法则是市场调研数 ...
2025-07-07CDA数据分析师证书考试全攻略 在数字化浪潮席卷全球的当下,数据已成为企业决策、行业发展的核心驱动力,数据分析师也因此成为 ...
2025-07-07剖析 CDA 数据分析师考试题型:解锁高效备考与答题策略 CDA(Certified Data Analyst)数据分析师考试作为衡量数据专业能力的 ...
2025-07-04SQL Server 字符串截取转日期:解锁数据处理的关键技能 在数据处理与分析工作中,数据格式的规范性是保证后续分析准确性的基础 ...
2025-07-04CDA 数据分析师视角:从数据迷雾中探寻商业真相 在数字化浪潮席卷全球的今天,数据已成为企业决策的核心驱动力,CDA(Certifie ...
2025-07-04CDA 数据分析师:开启数据职业发展新征程 在数据成为核心生产要素的今天,数据分析师的职业价值愈发凸显。CDA(Certified D ...
2025-07-03