
大数据在美国 已完成从灰姑娘到公主的蜕变
大数据的老家在哪里?如果从血脉渊源来看,应该在美国。麦肯锡的报告、自然杂志的专刊,以及Gartner、IBM专家的演说都证明了这一点。今天我们就来聊一聊她和她的家乡。
起初,她只是一位灰姑娘
要想富先修路,美国从上世纪50年代开始修路,建起了全美的高速公路网。修路不是一件简单的事情,要人要钱要技术,不过这也正好解决了就业、刺激了经济。路修好了又拉近了距离,人活了,货活了,钱更活了,想去哪里去哪里。
上世纪90年代,风流倜傥的克林顿总统提出要将路修到互联网去,随后全美信息高速公路声势浩荡地开建了。
20年后,这条路修好了,路上承载了更多信息,文字、图片、影音… 类型越来越多,数量也越来越大,不仅如此,以前一年产生的量,如今一个月就生成了。不知不觉中,有人开始头疼如何处理他们,有人开始关注如何挖掘他们,于是,大数据这位灰姑娘进入了人们的视野。
联邦政府看上她
这位灰姑娘的出现,引得越来越多人关注,终于有一天联邦政府看上了她。2012年,奥巴马政府正在筹划修建另一条路,这条路隐于无形,联系着万事万物,像神经一样重要却不可见。那么这次修路的工具和材料哪里来呢,“众里寻他千百度,蓦然回首,那人却在灯火栏珊处”,他们的这次相遇注定将被载入史册。
2012年3月,白宫发布了「大数据研究和发展倡议」(「Big Data Research and Development Initiative」),家里六个兄弟纷纷斥巨资同她合作,听说加起来超过了2亿美元。科学基金(NSF)、卫生研究院(NIH)、能源部(DOE)、国防部(DOD)、国防部高级研究计划局(DARPA)、地质勘探局(USGS)这六个兄弟禀赋异常,与大数据联合起来,简直就是传说中的葫芦七兄妹。
他们的项目列表涵盖了科研教学、环境保护、工程技术、国土安全、生物医药好多领域,半年后,美国再次公布了一批研究项目。至此,美国大数据战略2.0版闪亮登场。
天使与恶魔只在一念间
水能载舟亦能覆舟,如何面对大数据的超能力,联邦政府开始纠结了。2014年5月,白宫发布了白皮书「大数据:抓住机遇,保存价值」(「Big data:seizing opportunities, preserving values」)
“抓住机遇,保存价值”—原以为是保存大数据妹妹的价值,通篇读完才知道这是美国人的思维,他们关注的是大数据的超能力对美国价值观的冲击。
这一切源于奥巴马对情报问题的关注。顾问团队90天后提交了两份报告,一份是白皮书,另一份是「从技术角度看待大数据与隐私保护」。(「Big Data and Privacy: A Technological Perspective」)。这让我想到此前去上海电力调研的收获,上海电力信息部门统管科技项目和信息化项目,他们第一年通过科技项目做可行性研究,条件具备的话第二年再上信息化项目。这种台面上一杯水台下一桶水的做法还是靠谱的
整份报告很纠结,也很让人欣慰。
也许我们没有想过大数据可能带来不平等—连锁超市通过数据分析选择在不同区域差异定价造成价格歧视,不使用智能手机人群在打车软件面世后更难打车。
也许我们没有想过大数据可能带来伤害–基因预测模型一旦出错则会误伤一片。
也许我们同样没有想过大数据可能对社会造成潜移默化的负面影响—过滤器泡泡正在孜孜不倦的构筑意识形态和文化的隔离,使每个人都沉浸在自己感兴趣的信息当中,减少冲突体验。时间长了,人们对熟悉领域的愿望和期待增强了,却慢慢忘记了那潜伏在暗夜的,未知爪牙。
纠结完,接下来开始大干一场吧。
兄妹同心 其利断金
大数据给美国政府装上了动力外骨骼。以纽约为例,那里设立了市长数据分析办公室(MODA),通过数据分析来提升政府日常运作水平、预防和处置紧急事件,MODA还和新企业加速服务团队(NBAT)合作,利用量化分析手段评估政府决策。市政府出台一个政策,他们就数据分析这个政策效果如何,好的话就推广不好的话就砍掉。
大数据在美国的公共事业领域也大显身手。美国教育和医疗的信息化一直都走在全球前列,有了大数据,他们可以更进一步了。学校关注如何通过数据分析,来调整教学方法。卫生研究院(NIH)、食品和药物管理局(FDA)这些机构一方面力推生物医学数据共享重用,另一方面着手研发大数据医疗神器,包括流行病预测的、重大疾病早期诊断的,还有像大白这样实时个性化服务的。能源部(DOE)资助建设大数据平台,鼓励公众高效利用能源。波士顿市和麻省理工学院合作利用大数据提供城市交通解决方案。
联邦政府与大数据的这一次合作背后还有很多神秘人物默默支持,他们一方面通过特许协议、年度协议与政府保持联系,另一方面以大咖身份投资最领先的大数据技术,In-Q-Tel(IQT)就是其中的一员,IQT投资了很多数据分析和数据管理的公司,而且主要进行早期投资,尽管投资总额小于红杉、英特尔等大佬,但是参与的大数据领域早期投资数量位居全美第三。
腹有诗书气质华
大数据在美国不是花瓶,她不仅天生丽质,而且勤奋努力,技术功底是相当的扎实。
美国是流行大数据计算框架的发源地。从Google说起,到Hadoop、Spark、Storm,这些框架都来自这里。活跃的开源社区还汇集了全球大数据人才的头脑。
美国还有一批像51区那样神秘的研究机构,硅图(SGI)是其中之一,谁也说不好这家公司目前正在发展怎样的尖端超级计算能力。这些日常生活中鲜有接触的重型装备,在制造业、媒体、生命科学和地球科学这些数据密集型行业可是大有用处。
美国高校也正孕育着一群科学小狂人儿。伊利诺伊大学在Grainger基金会的资助下正在发展一门大数据的工程学科,并且把它当做其他跨学科创新活动的秘密武器。纽约大学、伯克利和华盛顿大学在摩尔和斯隆基金会支持下也在小黄人儿的帮助下开展秘密研究活动。
阿凡达中的灵魂树
大数据已经渗透到美国生产生活的方方面面。这一次的工业对决中,德国工业4.0企图从工业渗透到互联网,美国则要从互联网渗透到工业。美国建设国家制造业创新网络(NNMI),其背后的杀手锏想必就是大数据了。
在零售领域,看看啤酒尿片经典案例诞生地沃尔玛的收购名单就已经让人惊叹不已,Kosmix、SetDirection、OneRiot一大批数据分析和营销应用的初创企业都赫然出现在名单上。农业方面,孟山都这类大型企业不用说了,就连家庭农场主也都将大数据运用得游刃有余,关键是还得到了丰厚的回报。
IBM、Oracle那一帮大佬自然不会落后。IBM将大数据列为企业战略目标,将软件、硬件、咨询服务、研发各个领域的资源都整合起来,正在积蓄着发一个大招。甲骨文也强调垂直整合,早在2011年就推出了集成硬件、存储和软件的大数据机。微软也推出了一体机和大数据产品,明确了普及计算和环境智能的发展战略。英特尔推出Hadoop商业发行版,入股了很多公司。EMC也不断加大并购和研发的投入。
美国最大的亮点的应该还是谷里风起云涌的初创企业,像Cloudera、Hortonworks、MapR这些公司在Hadoop上深耕,Splunk把实时数据分析系统做得越来越强大,Databricks又称为给力Spark,Pivotal提供了企业级大数据基础平台,Tableau的可视化萌萌哒,Flatiron Health试图利用大数据来治愈癌症,人工智能公司Vicarious正在复制人类大脑皮层,还有像Palantir这种帅呆又神秘的大数据分析公司。
我们对她的了解还是太少
上面看起来热闹非凡的场景,放到20年后来看或许只是发动汽车的扬尘。她太神秘、太美丽、太强大,或许以相来求她是错的,或许她终究是无处不在的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-252025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-25从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-25用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18