
大数据要注重以人为本
大数据为什么会这么火?上世纪80年代,未来学家托夫勒在那本闻名世界的《第三次浪潮》一书中就预言过:“如果说IBM的主机拉开了信息化革命的大幕,那么大数据才是第三次浪潮的华彩乐章。”确实,自从计算机被发明并投入应用以来,作为信息化的主要产物——数据就呈现出了前所未有的快速增长,尤其是互联网逐步的普及,更是加速了数据产生的规模。
“大数据”无疑是当下的一个时髦词汇。如果使用Google搜索“Big data”,你可以得到636,000,000 条结果。目前,大数据在全球所形成的市场规模超过了50亿美元,预计到2017年将增长到500亿美元以上。
在大数据如火如荼增长的背后,是人们参与数据制造的数量的增加。目前,全球的互联网网民约在25亿左右,中国的网民总数在6亿左右,按照这种发展趋势,全球人口一半成为网民可能在2016年左右发生。正是有了这么多“个体”或“小我”的聚集,才带来了大数据的时代。而开发应用大数据,也一定要重视“小我”,让大数据开发出的结果更加人性化、更具合理性。
基于大数据开发出的精准营销等一系列新的商业模式,正在推动营销理念和商业模式的变革。但即便这种已经具备了“个性化”的模式,还是缺少“人情味”。美国一家连锁超市曾经根据某位消费者的购物数据预测出她已经怀孕,就将婴儿尿片和童车的优惠券直接派发给了她,但却遭到了其父亲的强烈抗议。原因是这个女孩还未满18岁,而且她和家人都还没有意识到自己已经怀孕的事实。虽然这被看作是大数据开发应用的一个典型案例,但实际上却暴露了这种精准营销背后存在的社会伦理缺陷。
现在,很多网站根据用户使用网络进行商品搜索或者网上购物的记录,直接在用户再次访问网站时加载相关广告等作法,往往会引起用户的反感。这种只顾商业利益,而不考虑用户感受的营销,实际上变相地剥夺了消费者的权利,这些作法本身也削减了消费者的购物欲望,起到适得其反的作用。
大数据开发目前除了在工业领域、商业领域应用外,也在向社会管理领域大步迈进着。在《爆发》这本讲述大数据时代的代表性着作中,作者巴拉巴西有这样的判断:人类行为中有93%是可以预测的。正是这个判断,增添了一些人在社会管理领域应用大数据的激情。但要看到,这个判断的前提是要对全球每个个体的24小时、每分每秒,甚至一生的行为进行数据采集。这显然在短时间内是无法实现的。
即便是我们的技术能力达到了那个水平,但是对一个有血有肉的人的行为进行预测,对由千百万个活生生的个体所构成的社会进行精确性管理,除了用好数据外,更要注重遵循人和社会自身的特点和规律,这样才能使大数据时代的社会管理更具合理性。如果完全把社会管理模式建立在数据的分析和应用上,这样的管理方式很可能会给人类社会的发展带来巨大的风险。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15