京公网安备 11010802034615号
经营许可证编号:京B2-20210330
惊人大数据创造效率和价值
数据成为流入全球经济每一个领域的洪流1.企业产生了数量迅速增加的交易数据,获取着有关客户、供应商和业务运营的数以Tb的信息。实体世界中,数以百万计的联网传感器被嵌入到各种设备中,例如手机、“智能”
能量计、汽车,以及在物联网时代能感知、创造和传达数据的工业机械2.的确,随着企业和组织开展经营以及与个人互动,他们产生着数量巨大的数字化“排出数据”,也就是作为其他活动的副产品而创造出的数据。社交媒体网站、智能电话以及其他消费电子设备(包括PC机和笔记本)使得全球数十亿人为可获得的大数据添砖加瓦。不断增多的多媒体内容对于“大数据”数量的指数增长起了重要作用。例如,每一秒的高清视频产生的比特量是存储一页文本所需的2,000多倍。在数字化世界中,消费者每天的生活--通讯、上网浏览、购物、分享、搜索--产生着数量庞大的数据。
我们说的“大数据”是什么意思?
大数据是指其规模超出通常的数据库软件工具的获取、存储、管理和分析能力的数据集。这一定义有意采用主观方式,包含了关于一个数据集有多大才可被视为大数据的动态定义--也就是说,我们并不从大于一定数量的Tb(1Tb等于1,024Gb)这一角度来定义大数据。我们假定,随着技术不断进步,可称为大数据的数据集的规模也将提高。另外,请注意,该定义可因经济部门而异,这取决于某一特定行业中通常可获得的软件有哪些,以及常见的数据集规模多大。有了以上说明,目前许多部门中的大数据范围为数十Tb到数Pb(1Pb等于1,024Tb)不等。
数量惊人的数据本身是一个全球性现象,但是,这意味着什么呢?全球许多公民对这一信息的集合抱以深深的怀疑,认为数据洪流不过是对其隐私的侵犯。但是,存在有力的证据表明,大数据可以发挥重要的经济作用,不但有利于私人商业活动,还有利于国民经济和公民。我们的研究发现,数据可以为世界经济创造重要价值,提高企业和公共部门的生产率和竞争力,并为消费者创造大量的经济剩余。
例如,如果美国医疗卫生部门能够富有创造性而有效地利用大数据来提高效率和质量,我们估计,该部门每年通过数据获得的潜在价值可超过3000亿美元,其中2/3将以全国医疗卫生支出降低大于8%的形式表现出来。例如,在私营部门,我们估计充分利用大数据的零售商有可能将其经营利润提高60%以上。在欧洲发达经济体中,我们估计,仅通过利用大数据实现的运作效率提高,政府行政管理方面可以节省1000亿欧元(1400亿美元)以上的开支。这一估计尚未包括可以用来减少欺诈、错误以及税差(潜在税收与实际税收收入之差)的大数据影响作用。
数字化数据现在无所不在--每个部门中,每个经济体中,每个组织以及数字技术用户中。这一话题以前只有少数数据怪杰感兴趣,而现在大数据对各个部门的领导都具有重要意义,各种产品和服务的消费者必将通过大数据的应用而受益。随着计算领域中的摩尔定律、数字存储中的类似的定律以及云计算等趋势继续降低成本以及减少其他技术壁垒,人们存储、汇聚和组合数据然后利用其结果来进行深入分析的能力超过以往任何时候。花不到600美元,就可以买到容量足以存储世界上所有音乐的硬盘.[page]
随着运用越来越尖端的技术的软件与不断提高的计算能力相结合,从数据中提取洞见的能力也在显着提高。此外,由于越来越多的人、设备和传感器通过数字网络连接起来,产生、传送、分享和访问数据的能力也得到彻底变革。2010年,超过40亿人(世界人口的60%)在使用手机,其中大约12%拥有智能电话--其渗透率以每年20%以上的速度增长。如今,3000多万联网传感器节点分布在交通、汽车、工业、公用事业和零售部门,其数量正以每年30%以上的速度增长。
可以通过许多方式来利用大数据在全球经济的各个部门中创造价值。的确,我们的研究表明,整个世界正处在一波巨大的创新、效率和增长之中,正处在竞争和价值获取的新模式的变革时代--所有这些都被大数据所推动,消费者、企业和经济部门无一不在挖掘利用大数据的潜力。但是,这一现象为何现在才发生呢?数据不是一直都是信息和通信技术的冲击中的一部分吗?是的,但是,我们的研究表明,大数据将会带来的变化的规模以及范围处在一个转折点上,随着一系列技术趋势开始加速并汇聚,必将大大扩展大数据的影响。我们已经看到这种汇聚在经济格局中带来的变化。
许多领先的企业已经在使用大数据创造价值,其他企业如果要与之竞争,需要探索如何做到这一点。政府在公共资金受到约束的时期,也面临着提高效率和为公民提供的资金带来的价值的机遇。鉴于全球许多国家人口老龄化这一现实,这一点可能非常重要。我们的研究表明,公共部门可以通过有效地使用大数据来显着提高效率。
然而,企业和其他组织以及政策制定者如果要充分发挥大数据的潜力,就需要应对很多挑战。能够掌握这些技术以获得最大价值的分析和管理人才不足,这是一个重大而紧迫的挑战,企业和政策制定者可以近期内着手解决。仅美国就短缺140,000 到 190,000具备深厚分析技能的人员,以及150万分析大数据并在其发现的基础上做出决策的管理人员和分析师。人才短缺仅仅是第一个挑战。其他挑战包括需要确保适当的基础设施落实到位,并且激励措施和竞争能够鼓励继续创新。此外,必须正确理解对于用户、组织和经济体带来的经济收益,而且必须实施安全措施,以便消除公众对大数据的担忧。
我们如何衡量大数据的价值?
当我们着手确定大数据创造价值的潜力多大时,我们只考虑了那些本质上依赖于大数据的使用的行为--也就是说,那些大数据的使用对于实施某一特定手段来说是必要(但往往未必足够)的行为。我们并未包括那些只包括自动化而并未涉及大数据的手段(例如,通过以ATM代替银行出纳而实现的生产率提高)的价值。另请注意,我们包括了需要使用大数据的手段的总价值。我们并未试图估计大数据对于某一特定手段创造的价值的相对贡献,而只是估计所创造的总价值。
我们完全可以预料,随着运用大数据的技术和技巧不断发展以及经济收益的增长(同时伴随着相关挑战和风险),有关大数据的故事将继续演变。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22