京公网安备 11010802034615号
经营许可证编号:京B2-20210330
落地开花,大数据的应用领域在不断拓宽
1、数据已经成为可交易的重要资产
数据的价值在于能够产生业务价值,而产生业务价值的多少取决于数据带来的视野的宽度和深度,以及对明智决策的支持度。从这个角度将,在资源不限的理想情况下,越多的数据来源,越能够带来宽度和广度,从而得到越好的决策支持度。数据,毫无疑问已经成为了一种企业资产, 并且会成为越来越重要的资产,未来甚至可能进入资产负债表。
2015 年 4 月 15 日, 我国贵阳大数据交易所正式运营, 其交易的数据是基于底层数据,通过数据的清洗、分析、建模 、可视化后的结果, 大数据交易所本着以电子交易为主要形式,通过建立大叔局的网上交易系统,搭建交易平台。预计到 2020 年,大叔局交易所将形成日均 100 亿的数据交易金额, 发展到 1 万家与大数据有关的会员单位。
2. 云计算是大数据产业发展的助推器
云计算产业进入高速发展期。 云计算包括三个层次的服务:基础架构即服务( IaaS),平台即服务(PaaS)和软件即服务(SaaS)。来自 Oxford Economics 和 SAP 关于云计算采用的研究《The Cloud Grow Up》中提出, 69%的企业预计在未来三年内将会中度或者重度投资在云计算上,这意味着它们的核心业务功能将迁移到云上。 59%的企业认为他们使用了基于云计算的应用程序和平台系统,更好地管理和分析了数据,这反映了企业范围内进行数据分析和大数据计算日益增加的重要性。 Gartner 预测 2015 年全球云计算服务市场总收入将突破 1800 亿美元。 2015 年 2 月 , 国务院下发《关于促进云计算创新发展培育信息产业新业态的意见》提到:开展基于云计算的大数据应用示范,支持政府机构和企业创新大数据服务模式,政府部门要加大采购云计算服务的力度等一系列措施。云计算已经从概念走向实际应用, 已经进入高速发展期。
云计算降低了使用 IT 资源的门槛,为数据集中化创造了基础,极大的促进了大数据产业的发展。 云计算按需付费和资源共享的商业模式,大幅提高了 IT 基础设施的使用效率;IaaS 运营商不断降价,又极大满足中小企业对于技术基础设施的需求。未来企业将不用再购买服务器,直接购买终端,输送至数据中心,从而形成服务器集群产业链,满足了大数据存储和挖掘的需求。云计算中心基础设施的不断完善使得大型数据中心和 PaaS 类运行平台的趋于成熟,又为 SaaS 类应用业务市场的大规模启动创造了条件。 SaaS 应用的大规模使用降低了用户使用软件的成本,促进了企业信息化程度额提高,又进一步促进了数据集中化。
云端处理与移动互联网行业结合,将产生不计其数的交叉业务和个性化应用。而社交网络的广泛应用,又加速了信息的传播速度和范围,促进了数据的内生增长。物联网要求的海量存储和计算能力让廉价、高性能的云计算应用方案成为所有用户的自然选择。可以说,云计算的蓬勃发展,极大促进了移动互联网、社交网络和物联网的发展,使得更多数据被采集到云端,为大数据应用提供了数据基础;同时,云计算的高性能、低成本运算能力又为大数据分析提供了极佳的计算平台,极大的促进了大数据在各行业中的应用。 因此, 数据的爆炸式增长其背后的核心支撑是云计算产业的蓬勃发展。
3. 大数据的应用领域在不断拓宽
大数据实践包含多个维度, 按照行业划分,包括金融大数据、 医疗大数据、 交通大数据、运营商大数据、 互联网大数据、物流大数据等等, 每个行业根据其 IT 系统及互联网化的完善程度不同,其大数据发展的阶段各不相同。按照数据对象划分,包括互联网大数据、政府大数据、 企业大数据、 个人大数据, 目前,互联网大数据是已经开始得到有效利用的细分领域,而政府、企业和个人的大数据应用才刚刚开始, 是“互联网 +”背景下大数据应用的重要发展方向。
互联网大数据: 互联网上的数据多样、积累迅速, 包括用户行为数据、用户消费数据、用户 社交数据、 用户地理位臵数据等, 互联网企业是大数据领域的先驱, 各家互联网企业依托自身的数据优势,早已开始利用大数据技术尝试用户 行为分析、精准营销、产品优化、 信用记录分析等用途。
阿里巴巴是互联网企业中大数据应用的典范。 阿里巴巴旗下的淘宝最早于 2005 年开发“淘数据”,并在半年后成立专门的大数据团队,相继开发了自用的“无量神针”、“类目360”, 以及针对卖家的“数据魔方”、“黄金策”、“淘宝指数”、“聚石塔”等数据产品,为卖家提供增值服务, 探索盈利模式。 此后,阿里巴巴的大数据体系日益成熟, 确立了平台 、金融和数据的三大业务核心,三者相辅相成,目前的阿里巴巴金融帝国就是建立在其电商平台 +大数据之上的隐性巨人。 例如, 阿里依托电商数据积累推出阿里小贷和蚂蚁信用,本质在于通过大数据技术构建征信体系 , 为整个阿里体系金融业务的进一步拓展打下了充分的基础。
政府大数据: 政府是数据资源最丰富的部门之一,大量的优质数据资源集中在政府手中,各个政府部门掌握着构成社会基础的原始数据,例如金融数据、交通数据、医疗数据、旅游数据、电力数据、住房数据、海关数据、违法犯罪数据、教育数据、环保数据等等。目前,政府数据存在几方面的问题:第一,数据积累偏静态,没有做到动态更新,导致有些数据过于陈旧;第二,数据孤岛现象严重,没有做到数据开放和共享。倘若能将这些数据进行有效的管理和分析,其商业价值和社会价值都是不可估量的。
政府加大智慧城市建设,数据价值挖掘正当时。 目前,政府已经意识到数据的重要性,2012 年开始,政府就不断加大在智慧城市建设,包括智慧交通、智慧环保、智慧教育、智慧社区、 智能电网等各个与城市相关的细分领域。 2014 年 3 月,国务院印发的《国家新型城镇化规划 (2014-2020 年)》,明确要求推进智慧城市建设,统筹城市发展的物质资源、信息资源和智力资源利用,推动物联网、云计算、大数据等新一代信息技术创新应用。 2015 年 4 月 , 住建部公布第三批智慧城市试点城市,加上前两批,目前我国的智慧城市试点已经达到 297 个。 智慧城市建设将完善城市各个细分领域的信息化水平, 构建统一的数据平台,打破信息孤岛现象; 同时, 一些地方政府已经开始探索采用 PPP(Public-Private-Partnership) 的公私合营模式,逐渐开放部分数据, 让社会机构参与运营,挖掘数据价值。
以智慧交通为例, 通过信息化建设连接道路信息管理系统、交通信号系统、公共汽车系统、出租车系统、电子收费系统、 停车场系统等, 实现数据共享, 对于政府部门来说,通过实时挖掘为出行者和交通监管部门提供实时交通信息,有效缓解交通拥堵, 快速响应突发状况,为城市交通的良性运转提供科学的决策依据, 提高民生体验;对于参与企业来说, 可以在停车场、市民出行等领域提供增值服务,探索新商业模式。
企业大数据:在“互联网+” 时代,企业的互联网化将从传统的传播互联网化和销售互联网化, 走向供应链互联网化和经营逻辑互联网化, 运营模式已经开始发生巨大变化, 企业与供应商、 服务商、 渠道商、 客户 , 乃至终端用户 都可以通过信息技术建立密切的联系 。 如果说过去互联网的价值主要体现在与渠道和营销的整合上,那么这一次变革将是互联网与传统行业在价值链各个关键环节的深度融合。
一方面,对于供应链环节来说, 大数据可以直接应用于产品设计、 原材料采购、 产品制造、库存、物流、配送等各个供应链环节, 清晰地把握原材料采购量、 订单完成率、库存量及产品配送等情况, 优化供应链流程, 降低不必要的损耗。 另一方面,对于生产环节来说, 企业生产设备可以通过传感器和信息系统等实现机器与机器之间的相互连接,进而获取数据, 利用大数据技术进行存储、分析和可视化,最终得到“智能信息” 供决策者使用,调解生产过程以提高效率。 未来, 当信息技术发展到一定阶段,企业生产过程甚至可以根据消费者需求进行个性化定制, 实现柔性生产。

体育大数据: 例如体育数据分析师通过从 OPTA( Opta Sports 是一家总部位于英国伦敦的体育数据提供商)提供的 2010 年世界杯以来 22904 场正式比赛的数据中,研究了梅西和其他 16574 名足球运动员与足球相关的所有数据准确发现了梅西两个性: 1、 与巴萨其他队友的数字相比,梅西有关防守行为的数字相当地少,其他方面也能体现“他不去争抢势均力敌的高球”等缺点; 2、 与在巴萨时梅西的表现指为 0.262 相比, 在阿根廷国家队里只有 0.199, 体现了 梅西在两支球队中所起作用的差异。
个人大数据:个人信息往往保存在第三方手里, 例如个人用户在互联网上留存、 在政府部门登记在案等各类信息,此类信息实际上也是互联网、政府和企业用于分析用户 行为的基础。此外,随着可穿戴设备等新事物的兴起,个人信息的采集方式越来越多样化,数据积累 也在不断完善, 例如,可以通过可穿戴设备或植入芯片等感知技术来采集身体数据、 健康数据、地理位臵信息、运动数据、 社会关系数据、饮食数据等。 未来, 可以想象的应用场景是,个人用户可以将个人数据授权给第三方机构以实现特定用途, 例如,高血压患者可以将个人血压数据、 身体机能数据、饮食数据等授权给健康管理机构使用,由他们监控和使用这些数据,进而为用户制定有效的健康维护方案。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21