京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据是人类又一个技术乌托邦_数据分析师培训
说到大数据,最近互联网各种热词很多,各种概念满天飞,其中不乏有忽悠一说。大数据到底是什么,会给我们生活带来哪些影响?
【大数据是一个时代,“国家队”很及时】
去年底宣布的一个事情,将对未来有深远影响,现在大家还没意识到。
2013年11月19日,国家统计局与11家国内企业签署战略合作框架协议,合作内容涉及大数据应用统计标准,以及企业数据补充政府统计数据等领域。有分析称,在大数据国家战略日益强烈的情况下,统计局介入将进一步推动大数据的应用落地。
首先,大数据绝对不是忽悠,它是当下IT领域最时髦的词,简单说就是从各种数据中快速获取价值信息的能力。美国是最早发现和使用大数据科学价值的国家。2012年3月,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略,奥巴马政府甚至将大数据定义为“未来的新石油”。当时美国政府声明说通过提高美国从大型复杂的数据集中提取知识和管理的能力,来加强整个国家的竞争力,这被认为是跟互联网同一个级别的时代。显然,大数据不止是一个词汇,更是一门技术,是一个产业时代。
而中国作为世界上人口最多、GDP排名第二的国家,成立大数据国家队是非常及时的。大数据的精髓在于“大”,它不是抽样而是全样,它不是盲人摸到的象腿或者是象鼻子,而是整个大象本身,大数据的精妙处在于用的人越多越增持,通过这样一个模糊的宏观判断,能够完成一个精准的个体推荐,从而会让整个生产效率得到极大提高。
【不开放大数据,周边创业是无米之炊】
目前我国大数据应用还存在一些问题。
首先,大数据不是IT公司的专利。第一批国家统计局引入的战略合作伙伴,大多数还是聚焦在IT公司,其实不是只有IT公司才有大数据,如线下零售巨头企业在实体经济中积累了很大的数据资源,他们数据的深度和广度不亚于甚至超过互联网公司。第一批进入的合作伙伴之一上海钢联其实掌握了煤炭钢铁在内的大宗商品数据,这是国家统计局没有涉及到的。因此,非IT类公司、拥有巨大的业务形态的企业,都可以成为第二批国家统计局大数据合作伙伴。我们也看到,国家统计局作为国家法定职能部门把姿态放平,主动寻求和民营企业的合作,这是非常可喜的进步。
第二,拥有大数据的IT公司和非IT公司应该打破数据格局。我们看BAT(百度、阿里、腾讯),近期围绕微信和淘宝发生新一轮互相屏蔽,在早前百度和淘宝进行了屏蔽,这三家掌握搜索和社交和消费的数据,本来是三方的数据汇总才能拼凑出比较完整的网上信息图谱,但是三家公司为了彼此的商业利益,并没有体现出数据合作的意愿,而是互相封杀,这将给社会数据的流动带来伤害。因此,在保证一定商业利益的基础上,巨头的眼光应该放远一点,打破数据格局。这看起来是一个很难实现的乌托邦。不过任何美好的事情都需要乌托邦的愿景作为起步的。我们看到许多美好的事情,比如说全世界的互联网,全世界的人通过互联网联结在一起,开始大家觉得乌托邦,现在已经形成现实。
第三,应该呼吁政府相关部门进一步开放市场,因为围绕大数据不管是应用还是创业,最核心的是要有数据的源头,然后才能进行采集、编辑,重新编制。现在大量的关于国民经济或者说民生的数据其实还在封闭状态,在工商部门、银行、保险、公安、医院、社保,包括电信运营商机构的手里。如何让这些数据流动起来,能让大家更方便,其实应该由政府带头实现等级制数据的开放共享。在不违反保密或者是国防的情况下,如果不开放大数据,那么大数据研究和创业都是无米之炊。
所以还是应该抓住这个机遇,进一步开放市场,不断试点,一步一步把数据开放转起来,带来更多的应用价值。
【隐私保护与数据精准之间的平衡】
数据应该共融共通,还要开放市场。这个开放市场不仅仅是企业之间开放,企业对个人也要开放。
为什么现在开放变得这么谨慎?因为开放有风险,一是安全问题,二是伦理问题。安全问题是对于国防、军事以及整个经济信息的保密顾虑而言;伦理问题是从个体角度而言,即网民的隐私。大数据的作者曾经说过,在一个有组织的社会里,几乎每一则信息都在不同的时候,以不同的形式公开过。就公民而言,他的信息一次性在网上公开,和第一种情况有本质区别。
大数据平台在提供服务的同时,也在时刻收集用户的各种消费习惯、浏览习惯甚至生活习惯。如何保护用户的隐私成了大数据时代发展过程中不可回避的问题。因此,大数据的应用价值在于个人隐私保护与数据精准之间的平衡。
要真正做到大数据的开放,还需要很长的路走。我们相信,大数据会成为互联网之后,人类又一个技术乌托邦。大数据的启动跟互联网有着相同的逻辑,一开始大家谈,不知道怎么做,会有一轮甚至几轮比较明显的产业泡沫,但是随着那些看似乌托邦的愿景,一个技术、一个尝试的创业公司的进入,会一步一步变成现实。
未来大数据会怎样,创业者跟投资者都需要很谨慎。目前来说,就大数据做预测是非常危险的事情,比较谨慎的说,可能在三年左右会看到一些具体的、受到社会应用的大数据,往长期看则还是未知数。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11