京公网安备 11010802034615号
经营许可证编号:京B2-20210330
中国的大数据该如何腾飞
大数据,首先意味着海量数据,并且彻底改变了数据利用的理念。分析所可能产生的全部数据成为可能,这必然使得人们改变过去沿用多时的抽样分析方法,而要善于快速乃至实时对海量(全部)数据作出反应。过去的抽样分析会带来样本分布的偏差,从而使得有限数据得出的结论发生扭曲;而大数据时代的数据挖掘分析,并不意味着分析难度的降低,相反可能更高。
当然,在大数据时代,通常意义上也不需要分析全部数据。“大数据时代的预言家”、牛津大学网络学院互联网研究所治理与监管专业教授维克托·迈尔-舍恩伯格就曾指出,大数据用概率说话,海量数据中将被提取出部分的有效数据,只要由此实现的数据挖掘精确度高于过去的抽样分析。分析全部数据在技术上是可能的,在成本上是不可行的,更何况当下的时间成本常常要比经济成本更重要。
大数据从一个带有前瞻性的新型概念,到推动计算机、互联网等信息产业以及传统产业、公共管理等诸多方面实现重大变化,为时并不久远。也就是说,大数据的发展速度相当惊人。遗憾的是,很多人对大数据的理解仍然停留在对以往若干个新锐创业、互联网概念的理解层次上,将大数据带来的创新、发展机遇看成是“忽悠”,对大数据时代正在发生的行业和社会关系变化视而不见。而在宏观层面,国家工信部官员也曾指出,“我国大数据产业同样面临着人才匮乏、数据资源不够丰富、数据开放程度较低、相关的法律法规不完善等问题”。
从我们每个人更可能扮演的消费者、上班族、数字产品使用者等角色来看,大数据也已经深刻的改变了我们的消费、社交和工作,其作用还将进一步提升。套用一句热门的话,你可以不关心大数据,大数据却要关心你。任何技术使用都具有两面性,在带给人以独特便利的同时,会对既有的社会关系及人的习惯造成冲击,甚至损害使用者或他人的权益。大数据建立在数据挖掘与分析基础上,由此实现预测,将有助于公共管理部门和企业对普通人实施更严密的控制。美国已经有社交网站为企业预测员工的离职倾向,这一指数较高的员工将无法获得提升;金融机构通过大数据技术,得出客户群体消费倾向与不良记录的相关性指数,一方面诱导用户更为便利的进行更多冲动消费,另一方面则对部分用户设置更严格的贷款、信用卡申请批准限制;保险公司会根据客户的医疗、消费数据,对其可能的死亡期进行预判,从而拒绝部分用户的投保购买。
《大数据在中国》书中分别以大数据对于创业者而言的创业创新机会、大数据对于政府部门提出的加快立法和推动公共管理转型的压力、大数据对于互联网巨头重新划分行业布局的重要机遇、大数据对于科技领域带来的激活各相关领域连带式创新的契机、大数据为消费者获得更多应用便利及隐私泄露威胁等各方面视角,对大数据问题进行了全面叙述。叙述中,书作者汇集了国内外诸多大数据研究分析著作的精华观点,并结合中国大数据发展的实际,向中国读者普及大数据概念。
值得一提的是,这本书有意识的分别选取了美国和我国大数据产业的多个案例,归纳了大数据发展的共性规律,分析指出了中国大数据产业落后于美国的主要痼疾,并发出了加快发展中国大数据产业、加快大数据立法和相关公共管理模式转型、加强大数据时代隐私安全机制建设和公民理念培育等呼吁。书作者特别强调,在蓬勃发展的互联网时代,大数据可以帮助政府、企业等各类组织摆脱旧的管理模式,走向更为光明的未来,但要实现这一点,当前政府就必须抓住大数据发展的基础设施、产业链、人才、技术和立法五大关键要素。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12