
不关注人性的大数据,只是大忽悠_数据分析师培训
斯大林曾说:一个人的死是悲剧,一百万个人的死就是数据。如果拿医学界的术语,这是一种共情疲劳,如果换成时下最流行的术语,就是我们还无法处理大数据。
上周参加腾讯思享会,主题就是“大数据将如何影响社会变革”。场间针对大数据,提出了不同的声音,有“数据孤岛论”:现有的大数据是断裂而封闭的,比如腾讯说自己有某方面的全数据,但是否有百度,有阿里的?有“数据阴谋论”:现在在用大数据做事的就是大企业和政府机构,如果我们普通人不能掌握,那就是被一个无形的网所束缚、所监控。有从经济安全角度来看待大数据处理“黑箱”问题时的作用。也有从实践角度来谈论大数据在商界中的应用。但最触动我的是下面两个观点。这里简单摘编下以飧读者。
不关注人性的大数据是大忽悠---刘德寰
现在主流对大数据的理解是基于维克托的《大数据时代》进行二次改良。但这其中有两个十分值得商榷的观点,一是对抽样的极端蔑视,二是无原则的推崇相关。大数据是一种抛弃随机分析法(抽样调查)而对所有数据进行处理,那么这其中就存在一个由斯坦福Trevor Hastie提出的问题,如何在稻草里找一根针,前提是很多稻草长得和针一样。这是我们所有大数据研究面临的最大风险,数据太大之后带来的实际上是一个规律的丧失和失真,千万不要忽视了抽样。
抛开这两个观点,更为可怕的是现在的大数据鲜有关注人性。先举个生活中大家都遇到过的问题,一个人去网上买了5升的洗衣液,整个流程花费了不到1分钟。第二天浏览网页,他发现旁边的广告就是各种各样的洗衣液。这是什么?基于大数据的精准营销? 这恐怕是基于大忽悠的精准骚扰吧。 有点常识的人都知道,5升的洗衣液就算家里人再多也要用一个月,而且那个人流程这么短,肯定就是品牌忠诚者,推广的应该是什么时候那个品牌的洗衣液会打折之类的,这才是大数据。人类早期研究问题的方法就是靠体会、知觉、体验、内省等,这些看起来跟大数据无关的东西可能恰恰是大数据的核心,因为它是思想。
谷歌2008年弄了一个非常厉害的东西叫流感趋势预测,它预测的结果比美国疾病控制中心还准,当时轰动了全球。结果后来里面东西越来越乱,严重的高估了流感的状态。为什么?这就是刚刚说的维克多流派谈大数据的时候重相关不重因果。流感跟发病的时间点,跟美国比如中学生篮球赛那个时间点是完全一致的,这俩概念能有关系吗?问题是只要搜索中学生的篮球赛,就构成了流感预测的一个主要的词之一。类似的东西太多了,为什么?因为在谷歌预测的时候,没有找疾控公共卫生的专家,这些东西才是进行大数据预测的一个很重要的前提。
基因工程才是真正的大数据
人有多少细胞?量级为10的14次方。 其中一个细胞癌变就能导致你生命的完结。难道这不是大数据?真正的大数据是生命大数据,基因筛查可以消灭先天性疾病和预防癌症,人类想在千年之后复活亦不是难事。可是这样的基因科技发展却遭遇了无数现实瓶颈和伦理挑战。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA 数据分析师:就业前景广阔的新兴职业 在当今数字化时代,数据已成为企业和组织决策的重要依据。数据分析师作为负责收集 ...
2025-06-30探秘卷积层:为何一个卷积层需要两个卷积核 在深度学习的世界里,卷积神经网络(CNN)凭借其强大的特征提取能力 ...
2025-06-30探索 CDA 数据分析师在线课程:开启数据洞察之旅 在数字化浪潮席卷全球的当下,数据已成为企业决策、创新与发展的核心驱 ...
2025-06-303D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32% 编辑:LRST 【新智元导读】中科院自动化所提出BridgeVLA模型,通过将 ...
2025-06-30LSTM 为何会产生误差?深入剖析其背后的原因 在深度学习领域,LSTM(Long Short-Term Memory)网络凭借其独特的记忆单元设 ...
2025-06-27LLM进入拖拽时代!只靠Prompt几秒定制大模型,效率飙升12000倍 【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新 ...
2025-06-27探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26CDA 数据分析师会被 AI 取代吗? 在当今数字化时代,数据的重要性日益凸显,数据分析师成为了众多企业不可或缺的角色 ...
2025-06-26CDA 数据分析师证书考取全攻略 在数字化浪潮汹涌的当下,数据已成为企业乃至整个社会发展的核心驱动力。数据分析师作 ...
2025-06-25人工智能在数据分析的应用场景 在数字化浪潮席卷全球的当下,数据以前所未有的速度增长,传统的数据分析方法逐渐难以满足海 ...
2025-06-25评估模型预测为正时的准确性 在机器学习与数据科学领域,模型预测的准确性是衡量其性能优劣的核心指标。尤其是当模型预测结 ...
2025-06-25CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-06-24金融行业的大数据变革:五大应用案例深度解析 在数字化浪潮中,金融行业正经历着深刻的变革,大数据技术的广泛应用 ...
2025-06-24Power Query 中实现移动加权平均的详细指南 在数据分析和处理中,移动加权平均是一种非常有用的计算方法,它能够根据不同数据 ...
2025-06-24数据驱动营销革命:解析数据分析在网络营销中的核心作用 在数字经济蓬勃发展的当下,网络营销已成为企业触达消费者 ...
2025-06-23随机森林模型与 OPLS-DA 的优缺点深度剖析 在数据分析与机器学习领域,随机森林模型与 OPLS-DA(正交偏最小二乘法判 ...
2025-06-23CDA 一级:开启数据分析师职业大门的钥匙 在数字化浪潮席卷全球的今天,数据已成为企业发展和决策的核心驱动力,数据分析师 ...
2025-06-23透视表内计算两个字段乘积的实用指南 在数据处理与分析的过程中,透视表凭借其强大的数据汇总和整理能力,成为了众多数据工 ...
2025-06-20CDA 一级考试备考时长全解析,助你高效备考 CDA(Certified Data Analyst)一级认证考试,作为数据分析师领域的重要资格认证, ...
2025-06-20