
大数据分析,投资和收益怎么算
大数据是业务,不是投资项目,它要联系到你的业务上去,比如你怎么获取更多新客户?你的业务怎么更为高效?一旦作为业务项目,你面临的就不是一个科技问题,是企业的一个流程问题。而这样的IT项目会有相应的预算和评估标准。
一次,摩根银行澳大利亚公司的CEO告诉Gartner研究副总裁Ian Bertram,他花了11个月的时间才雇佣到公司第一位“数据科学家”--这是大数据时代一类炙手可热的人才,他们可以从数据的角度来推动企业的业务。但过了一段时间,这位CEO又告诉Ian Bertram,他已经解聘了那位数据科学家,原因是“虽然他有好的理念,但没有与投行的业务很好地融合”。
大数据是业务不是科技
“我们在座的听众,2/3都会对大数据进行投资,但无论企业还是数据科学家都要明确一个观念--投资的目的是帮助企业的业务。”Ian Bertram日前在北京举办的大数据研讨会上说,“企业投资大数据不是为了纯粹的科技,他们要解决自身面临的业务挑战。”
根据统计,目前企业迫切要解决的业务问题排在前三的依次是提高用户的体验、提高公司效率以及如何进入新市场。Ian Bertram认为,企业需要在分析公司业务挑战、了解公司目标后制定战略,再投资所需的技能和能力。同时,一旦实施了这样的业务项目,企业和数据科学家需要追踪和衡量成果。“哪怕是客户忠诚度提高了1%,也要想办法追踪,形成ROI(投资回报)模型”.
现场有用户提问:“如果我投资一个大数据项目,如何评估成本和收益?” Ian Bertram 再次强调,如果大数据被当做一个项目来投资,那肯定要失败了。“大数据是业务,不是投资项目,它要联系到你的业务上去,比如你怎么获取更多新客户?你的业务怎么更为高效?一旦作为业务项目,你面临的就不是一个科技问题,是企业的一个流程问题。而这样的IT项目会有相应的预算和评估标准。”
Gartner研究总监Daniel Yuen举例说,现阶段大数据可以给企业业务带来一些明显的商业机会。例如,可以帮助企业做出更好的决策。他曾了解到,某家企业存储了自2003年以来所有关于企业的媒体报道。通过数据分析,这家企业能够提前预知媒体发布的形势,防范风险。大数据还可以发现隐藏在背后的信息。
例如,提供旅行推荐的电商平台ORBITZ,仅2012年就处理了750TB 数据,来深度分析顾客的行为,并以此改善网站推荐系统,这让网站的预订率增加了2.6%,平均每天多出5万笔交易。像电信运营商也可以通过分析数据,更好地了解用户的通信方式,制定适合的套餐,提供给用户使用。
此外,大数据还能帮助企业开展商业自动化。麦当劳在生产过程中,利用传感器来记录烤箱在每个温度下汉堡的颜色,通过分析,选择最合适的烤箱温度,实现生产自动化。
信息银行和数据资产
大数据除了能够帮助企业应对业务挑战,也能够变成企业的一项资产。
前不久,Ian Bertram在澳大利亚去看房子。他发现当地一些公司把房地产数据作为IP数据进行销售。这些数据被卖给木材、油漆等地产行业供应链企业,从而让这些企业更好地预测需求,安排生产供给;这些数据也被卖给银行,可以帮助银行制定借贷利率……“市场上已经有一些企业把信息作为资产来开展贸易。” Ian Bertram说,“虽然我们现在还没有看到‘信息银行',但信息已经可以在企业的财务报表上作为一种重要资产。我们可以预见,信息未来可以’存在银行中‘,不断产生利率。今后10年,人们将思考如何更好地利用信息。”
通用电气去年宣布了工业互联网战略。“这表明通用电气新的战场是信息分析。” Ian Bertram分析说,“他们将成千上万个传感器放在自己生产的设备上收集信息,并改善设备维修流程,提高企业的效率,形成新的生产力。” Ian Bertram预测,未来通用电气、ABB、西门子等的竞争将围绕在信息利用上。
Johnwest是澳洲一家生产罐装鱼的公司。他们发现,很多消费者担心产品的质量。于是,这家企业回到供应链的前端,利用一种RFID电子标签技术记录每次鱼是在哪里捕捉的,由谁捕捉的,在哪里冷藏的。消费者只要在一个网站上输入罐头上的编码就能追溯到这些信息。“这家企业只花了几百美元,就建立起来自消费者的信任,这就是我们如何利用信息资产来使自己利益最大化的一个好例子。” Ian Bertram总结说。
Ian Bertram获知,斯坦福大学曾经做过一个研究,研究者分析了过去20年企业变化及其股市表现之间的关系。他们发现,一直在做信息投资的企业比那些没有在这方面投资的企业,平均市值要高出5倍。
传统商业智能与大数据结合
在大数据概念产生以前,很多企业已经使用了商业智能(BI),这是一种对结构化数据进行分析,并推动企业业务的方式。Gartner研究总监Daniel Yuen说,现在大数据正在和传统BI结合。
“传统BI是对结构化数据开展分析,而大数据分析则包含结构化和非结构化两类数据源,这是两者的主要区别。”Daniel Yuen对《IT经理世界》记者说,“大数据尤其体现了对非结构化数据更好的分析和融合。”
Daniel Yuen介绍,一家企业引入了对呼叫中心的分析,他们分析了呼叫中心成千上万小时的录音,这些是非结构化数据,包括呼叫中心人员的表现,客户的投诉,情绪分析等等。通过这些分析,企业改善了业务流程,反馈延迟时间从原来几个月缩短到几天,呼叫中心人员的交叉销售能力也被提高。“这个大数据分析为企业节省了大笔咨询费用。” Daniel Yuen说。
Daniel Yuen建议,企业要结合大数据和传统BI,需要建立独立的大数据团队。“企业引入大数据分析,对自身的管理要求会更高,因为要充分利用大数据,更需要企业内部建立起不同层面的联系”.
大数据是下一代安全平台中心
大数据除了给企业业务带来直接的竞争力以外,对防范网络犯罪也正在起到越来越重要的作用。
“现在,黑客已经成为专业化市场,他们采用标准化服务流程编写恶意软件,去获取更多行业的数据。数据一旦进入黑市交易,可以卖很多钱。”Gartner研究总监Craig Lawson说。
“但在全球120亿美元的安全投资中,75亿美元是用于病毒抵御的,没有多少投资花在分析哪些数据被偷了。” Craig Lawson说,“在下一波安全设计上,我们需要监控数据的流向。”
现在,大数据用于信息安全领域,它可以分析好的程序长什么样子,坏的长成什么样子,分析数据的流向,从而加强企业的安全。例如,在金融领域,可以重演过去3个月中程序的调用情况,重演入侵对哪些系统抽取了哪些数据,从而更好地管理脆弱性;金融机构还可以利用大数据分析某个交易者过去100笔交易情况,或者一笔汇款的流动情况,来判断眼前的交易是否是一个欺诈交易。
“虽然用于信息安全的大数据技术在未来3到5年才能成熟,但我们会看到未来安全管理和大数据会紧密结合。”Craig Lawson说,“大数据分析将处于下一代安全信息平台的中心。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29