京公网安备 11010802034615号
经营许可证编号:京B2-20210330
从内部实践讲起 联想也谈大数据
继云计算在各行各业相继落地后,大数据与我们的关系也在日益密切。在笔者过往进行的客户采访中,有不少用户都表示当下正在进行一些大数据相关的工作,包括对各个业务平台的打通,数据共享、收集以及分析等,这也意味着大数据正在从“阳春白雪”走向“下里巴人”。
在近日召开的2015中国国际大数据大会上,包括移动、联通、电信及联想等在内的运营商及IT企业均分享了其在大数据领域的探索和布局。从它们身上能看到相同的是,几乎所有企业都意识到了大数据所蕴含的价值;不同的是,各企业在挖掘其价值的过程中,所处的阶段不尽相同,比如有的已经处于利用所挖掘的数据价值来提升业务的阶段,而有的还处于建模型、处理、分析数据的阶段。
大数据落地指日可待
而这可以说也是当前大数据发展现状的一个缩影,联想集团副总裁、联想研究院云计算与智能计算实验室主任黄莹会后在接受采访时表示,从兴起到今天,大数据的发展经历了所有新技术落地的各种必要过程,包括从概念认知、日渐接受,到今日的逐渐落地。这其中,大数据的价值归根结底在于帮助企业提升商业价值,这点已经毋庸置疑。
黄莹举了联想自身的例子来说明。他说,两年前,在联想内部推广大数据的时候,还要跟业务主管介绍大数据是干什么用的。但是从去年开始,各业务部门已经开始从一些小的应用着手进行尝试,到今年,大家对大数据已经完全没有怀疑,包括联想各个业务部门都有大数据方面的项目在进行。
这其实十分类似于人们接受一个新鲜事物的过程,开始不了解,有怀疑、质疑,逐渐了解后,进行尝试,当获得、或看到好处时则会大力推广。现在大数据所处的发展阶段就已经属于后者,用户不再追问大数据是什么,而是问我们怎么利用大数据。
具体来说,联想作为一个典型的制造企业,生产的产品有成百上千种,如何做到以客户为中心,其中很重要的一条就是聆听客户需求,及时改进,这也是联想内部做大数据研究的一个主要因素,即帮助其更好地改进产品。当然,一开始的进展也没有那么顺利,据黄莹介绍,最开始推广大数据的时候,也只有几个产品经理在用,不过随着时间的推进,越来越多的产品经理意识到了价值所在,到现在该大数据平台已经有成百上千个产品经理在使用。
对此,联想集团研究院大数据总监郭炜也表示,事实证明,现在大数据已经过了喊口号、炒概念的阶段,其现在与前沿的技术创新和实际应用的结合是非常快的,以前一个东西变成产品可能需要几年,现在一旦技术完备,真正应用到企业也就是几个月的时间。
利用大数据,最关键的是什么?
要分析这个首先还是要看看大数据都涉及哪些技术层面,粗略地概括,大致主要包括三个阶段:数据收集、收据分析和数据呈现。毫无疑问,这其中首先要解决的就是数据来源问题,然后才有分析、呈现、利用。以联想自身为例,一方面其将内部的数据孤岛打通,形成数据共享平台,另一方面利用爬虫技术去搜集互联网上关于联想的各种意见、建议,也就是说企业内部数据和外部来自用户的评论共同构成了数据源。
接下来要做到就是分析、呈现,有关这部分其实不用多讲,每天都有各种新的技术出现,这也不是难题。无论是黄莹还是之前的客户采访,但凡被问到这类问题,他们给出的答案都是一致的,那就是解决了数据来源问题,其他都好办,可见大数据、大数据,说到底首先得有数据。其次,才是分析、利用。
虽然在采访中,两位发言人都更多提及的是大数据在联想内部的实践,但截止当前,联想已经把这套实践经验总结、提炼,形成了面向用户的最终解决方案,在2015中国国际大数据大会的现场,联想也进行了展出。
都说实践才出真知,联想的亲身体验想必也能为用户带去价值,帮助用户少走弯路。更多关于联想大数据相关的解决方案,这里不详细展开,有兴趣的朋友可自行去查阅、咨询。总之,大数据所蕴藏的价值毋庸置疑,但在发掘、利用大数据价值的道路上,还是有很多沟沟坎坎要迈过的,找一个有实践经验的供应商,想必不是坏事。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22