京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代:生活、工作与思维的大变革
静下心来读维克托•迈尔•舍恩伯格与肯尼思•库克耶那本《大数据时代》,扑面而来的一个个事例,似曾相识。不经意间,互联网、社交网络、电子商务与移动通讯已经把人类社会带入了一个结构与非结构数据信息的新时代。我们身处其中的时代,已经是一个大规模生产、分享和应用数据的时代。
在书中,作者告诉人们,大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,一方面,对大数据的掌握程度可以转化为经济价值的来源,成为新发明和新服务的源泉;另一方面,大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域,而更多的改变正蓄势待发。
书中的论述是从“零”起步的。面对方兴未艾、众说纷纭的大数据,作者不急不火,从大数据的基本概念和特点娓娓道来,让一个个人们耳熟能详的事例,将读者带进认知大数据的殿堂,使人们在重温一个个故事中理解了大数据带给人们的思维变革、商业变革和管理变革。在“参观”了书中描述的一个个现实的情境之后,读者茅塞顿开:“哇,大数据不仅为我们呈现出身边的现实,还在为我们预测着事情发生的可能性。”不知不觉中,人们关注的已经不再是事物间的因果关系,而取而代之的是它们的相关关系,倾听数据的发声,成为更多人的行为习惯。大数据对千百年来人类思维惯性的颠覆,竟是这样不动声色。
在如数家珍地讲述着大数据给人类社会带来和即将带来的福祉的同时,作者也谨慎而又直率地告诫人们:大数据是一种资源,也是一种工具。它告知信息但不解释信息。它指导人们去理解,但有时也会引起误解,这取决于数据是否被正确使用。大数据的力量是那么耀眼,我们必须避免被它的光芒诱惑,并善于发现它固有的瑕疵。
“在这个利用数据做出决定的世界里,人类存在的目的是什么?难道是为了运用直觉和违背事实?”在发出这样的诘问之后,作者做出回答:如果所有人都诉诸数据,都利用工具,那时人类的无法预测性即直觉、冒险精神、意外和错误等,反倒会发挥出重大作用。由此,作者认为,如果真变成这样,为人类开辟出一块领地,为直觉、常识和意外运气腾出空间就十分必要,以确保它们不被数据和机器回答挤兑出去。人类最伟大之处正是运算法和硅片没有揭示也无法揭示的东西,因为数据也无法扑捉到这些。
作者指出,这为“社会进步”的概念提供了重要启示。大数据让我们试验的速度更快,发现的线索更多。这理应能够产生更多的创新成果,但发明的火花却往往存在于数据未显示出的信息之中,因为它并非真实存在,是多大量的数据都永远无法确定或证实的。在大数据的世界中,包括创意、直觉、冒险精神和知识野心在内的人类特性的培养显得尤为重要,因为进步正是源自我们的独创性。
《科学》杂志曾说,若要发起一场关乎大数据的深入讨论,没有比维克托•迈尔•舍恩伯格更好的发起者了。因为,他已潜心研究大数据达10年之久,是最早洞见大数据时代发展趋势的数据科学家之一,而且,他为大数据进入公众视野不竭余力。如今,他更身体力行,为公众写了这样一本书——《大数据时代》。
在大数据时代,认识我们生存其间的世界,认识我们人类自身,是我们捧起《大数据时代》来阅读的初衷。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22