
大数据的应用领域在不断拓宽
1、数据已经成为可交易的重要资产
数据的价值在于能够产生业务价值,而产生业务价值的多少取决于数据带来的视野的宽度和深度,以及对明智决策的支持度。从这个角度将,在资源不限的理想情况下,越多的数据来源,越能够带来宽度和广度,从而得到越好的决策支持度。数据,毫无疑问已经成为了一种企业资产, 并且会成为越来越重要的资产,未来甚至可能进入资产负债表。
2015 年 4 月 15 日, 我国贵阳大数据交易所正式运营, 其交易的数据是基于底层数据,通过数据的清洗、分析、建模 、可视化后的结果, 大数据交易所本着以电子交易为主要形式,通过建立大叔局的网上交易系统,搭建交易平台。预计到 2020 年,大叔局交易所将形成日均 100 亿的数据交易金额, 发展到 1 万家与大数据有关的会员单位。
2. 云计算是大数据产业发展的助推器
云计算产业进入高速发展期。 云计算包括三个层次的服务:基础架构即服务( IaaS),平台即服务(PaaS)和软件即服务(SaaS)。来自 Oxford Economics 和 SAP 关于云计算采用的研究《The Cloud Grow Up》中提出, 69%的企业预计在未来三年内将会中度或者重度投资在云计算上,这意味着它们的核心业务功能将迁移到云上。 59%的企业认为他们使用了基于云计算的应用程序和平台系统,更好地管理和分析了数据,这反映了企业范围内进行数据分析和大数据计算日益增加的重要性。 Gartner 预测 2015 年全球云计算服务市场总收入将突破 1800 亿美元。 2015 年 2 月 , 国务院下发《关于促进云计算创新发展培育信息产业新业态的意见》提到:开展基于云计算的大数据应用示范,支持政府机构和企业创新大数据服务模式,政府部门要加大采购云计算服务的力度等一系列措施。云计算已经从概念走向实际应用, 已经进入高速发展期。
云计算降低了使用 IT 资源的门槛,为数据集中化创造了基础,极大的促进了大数据产业的发展。 云计算按需付费和资源共享的商业模式,大幅提高了 IT 基础设施的使用效率;IaaS 运营商不断降价,又极大满足中小企业对于技术基础设施的需求。未来企业将不用再购买服务器,直接购买终端,输送至数据中心,从而形成服务器集群产业链,满足了大数据存储和挖掘的需求。云计算中心基础设施的不断完善使得大型数据中心和 PaaS 类运行平台的趋于成熟,又为 SaaS 类应用业务市场的大规模启动创造了条件。 SaaS 应用的大规模使用降低了用户使用软件的成本,促进了企业信息化程度额提高,又进一步促进了数据集中化。
云端处理与移动互联网行业结合,将产生不计其数的交叉业务和个性化应用。而社交网络的广泛应用,又加速了信息的传播速度和范围,促进了数据的内生增长。物联网要求的海量存储和计算能力让廉价、高性能的云计算应用方案成为所有用户的自然选择。可以说,云计算的蓬勃发展,极大促进了移动互联网、社交网络和物联网的发展,使得更多数据被采集到云端,为大数据应用提供了数据基础;同时,云计算的高性能、低成本运算能力又为大数据分析提供了极佳的计算平台,极大的促进了大数据在各行业中的应用。 因此, 数据的爆炸式增长其背后的核心支撑是云计算产业的蓬勃发展。
3. 大数据的应用领域在不断拓宽
大数据实践包含多个维度, 按照行业划分,包括金融大数据、 医疗大数据、 交通大数据、运营商大数据、 互联网大数据、物流大数据等等, 每个行业根据其 IT 系统及互联网化的完善程度不同,其大数据发展的阶段各不相同。按照数据对象划分,包括互联网大数据、政府大数据、 企业大数据、 个人大数据, 目前,互联网大数据是已经开始得到有效利用的细分领域,而政府、企业和个人的大数据应用才刚刚开始, 是“互联网 +”背景下大数据应用的重要发展方向。
互联网大数据: 互联网上的数据多样、积累迅速, 包括用户行为数据、用户消费数据、用户 社交数据、 用户地理位臵数据等, 互联网企业是大数据领域的先驱, 各家互联网企业依托自身的数据优势,早已开始利用大数据技术尝试用户 行为分析、精准营销、产品优化、 信用记录分析等用途。
阿里巴巴是互联网企业中大数据应用的典范。 阿里巴巴旗下的淘宝最早于 2005 年开发“淘数据”,并在半年后成立专门的大数据团队,相继开发了自用的“无量神针”、“类目360”, 以及针对卖家的“数据魔方”、“黄金策”、“淘宝指数”、“聚石塔”等数据产品,为卖家提供增值服务, 探索盈利模式。 此后,阿里巴巴的大数据体系日益成熟, 确立了平台 、金融和数据的三大业务核心,三者相辅相成,目前的阿里巴巴金融帝国就是建立在其电商平台 +大数据之上的隐性巨人。 例如, 阿里依托电商数据积累推出阿里小贷和蚂蚁信用,本质在于通过大数据技术构建征信体系 , 为整个阿里体系金融业务的进一步拓展打下了充分的基础。
政府大数据: 政府是数据资源最丰富的部门之一,大量的优质数据资源集中在政府手中,各个政府部门掌握着构成社会基础的原始数据,例如金融数据、交通数据、医疗数据、旅游数据、电力数据、住房数据、海关数据、违法犯罪数据、教育数据、环保数据等等。目前,政府数据存在几方面的问题:第一,数据积累偏静态,没有做到动态更新,导致有些数据过于陈旧;第二,数据孤岛现象严重,没有做到数据开放和共享。倘若能将这些数据进行有效的管理和分析,其商业价值和社会价值都是不可估量的。
政府加大智慧城市建设,数据价值挖掘正当时。 目前,政府已经意识到数据的重要性,2012 年开始,政府就不断加大在智慧城市建设,包括智慧交通、智慧环保、智慧教育、智慧社区、 智能电网等各个与城市相关的细分领域。 2014 年 3 月,国务院印发的《国家新型城镇化规划 (2014-2020 年)》,明确要求推进智慧城市建设,统筹城市发展的物质资源、信息资源和智力资源利用,推动物联网、云计算、大数据等新一代信息技术创新应用。 2015 年 4 月 , 住建部公布第三批智慧城市试点城市,加上前两批,目前我国的智慧城市试点已经达到 297 个。 智慧城市建设将完善城市各个细分领域的信息化水平, 构建统一的数据平台,打破信息孤岛现象; 同时, 一些地方政府已经开始探索采用 PPP(Public-Private-Partnership) 的公私合营模式,逐渐开放部分数据, 让社会机构参与运营,挖掘数据价值。
以智慧交通为例, 通过信息化建设连接道路信息管理系统、交通信号系统、公共汽车系统、出租车系统、电子收费系统、 停车场系统等, 实现数据共享, 对于政府部门来说,通过实时挖掘为出行者和交通监管部门提供实时交通信息,有效缓解交通拥堵, 快速响应突发状况,为城市交通的良性运转提供科学的决策依据, 提高民生体验;对于参与企业来说, 可以在停车场、市民出行等领域提供增值服务,探索新商业模式。
企业大数据:在“互联网+” 时代,企业的互联网化将从传统的传播互联网化和销售互联网化, 走向供应链互联网化和经营逻辑互联网化, 运营模式已经开始发生巨大变化, 企业与供应商、 服务商、 渠道商、 客户 , 乃至终端用户 都可以通过信息技术建立密切的联系 。 如果说过去互联网的价值主要体现在与渠道和营销的整合上,那么这一次变革将是互联网与传统行业在价值链各个关键环节的深度融合。
一方面,对于供应链环节来说, 大数据可以直接应用于产品设计、 原材料采购、 产品制造、库存、物流、配送等各个供应链环节, 清晰地把握原材料采购量、 订单完成率、库存量及产品配送等情况, 优化供应链流程, 降低不必要的损耗。 另一方面,对于生产环节来说, 企业生产设备可以通过传感器和信息系统等实现机器与机器之间的相互连接,进而获取数据, 利用大数据技术进行存储、分析和可视化,最终得到“智能信息” 供决策者使用,调解生产过程以提高效率。 未来, 当信息技术发展到一定阶段,企业生产过程甚至可以根据消费者需求进行个性化定制, 实现柔性生产。
体育大数据: 例如体育数据分析师通过从 OPTA( Opta Sports 是一家总部位于英国伦敦的体育数据提供商)提供的 2010 年世界杯以来 22904 场正式比赛的数据中,研究了梅西和其他 16574 名足球运动员与足球相关的所有数据准确发现了梅西两个性: 1、 与巴萨其他队友的数字相比,梅西有关防守行为的数字相当地少,其他方面也能体现“他不去争抢势均力敌的高球”等缺点; 2、 与在巴萨时梅西的表现指为 0.262 相比, 在阿根廷国家队里只有 0.199, 体现了 梅西在两支球队中所起作用的差异。
个人大数据:个人信息往往保存在第三方手里, 例如个人用户在互联网上留存、 在政府部门登记在案等各类信息,此类信息实际上也是互联网、政府和企业用于分析用户 行为的基础。此外,随着可穿戴设备等新事物的兴起,个人信息的采集方式越来越多样化,数据积累 也在不断完善, 例如,可以通过可穿戴设备或植入芯片等感知技术来采集身体数据、 健康数据、地理位臵信息、运动数据、 社会关系数据、饮食数据等。 未来, 可以想象的应用场景是,个人用户可以将个人数据授权给第三方机构以实现特定用途, 例如,高血压患者可以将个人血压数据、 身体机能数据、饮食数据等授权给健康管理机构使用,由他们监控和使用这些数据,进而为用户制定有效的健康维护方案。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23