京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据公司如何从大数据中获取价值
大数据公司该如何从大数据中获取价值
在人们意料之中,大数据产业在今天上升到了很高的地位!
8月6日,工信部的消息显示,大数据产业十三五规划编制工作已正式启动,日前已在工信部信息化和软件服务业司组织下,召开了规划编制第一次工作会议,成立了规划编制小组,讨论了规划编制工作方案、规划草案、任务分工、近期工作安排等。
大数据产业的未来,越来越值得人们期待。但如何从大数据上获取价值,却是一个很让人头疼的问题。
就在前几天,笔者读到一段很“不合潮流”的话。在一次演讲中,华为轮值CEO徐直军表示:“华为不是一个数据公司,不经营数据,永远不从数据上获取价值。而是与更多和合作伙伴一起来保护我们客户的数据,使客户数据更安全,解决客户面向未来的问题,使客户真正实现信息化!”
对于他的说法,我是持怀疑态度的,甚至感到他说的很不严谨。如果从文字上细细琢磨的话,对客户数据的保护其实也是一种对大数据的利用,保护大数据带来的价值,也是大数据的变现。大数据时代的安全防护,难道不也是一种产业分支吗?在别人利用客户大数据发广告的时候,你保护了这些大数据,除非你是免费的,否则怎么会没有价值产生?即便是360的免费杀毒,也在别的地方产生价值了。华为的大数据,又怎么能独善其身?
很显然,没有人可以游离于大数据的价值之外。不再搞一些文字方面的纠缠了,其实我举徐直军这段话的目的,无非是想说明这一点:“大数据,不经意间就会产生价值。”于是,再回到一开始那个问题:“大数据公司该如何从大数据上获取价值?”
对于这个问题,一直以来我个人的观点是这样的:“第一,大数据必须要利用,否则就是浪费,同时弃之不用也对我们的发展不利。第二,大数据的利用要遵循三个原则,一是不能以影响用户体验为代价,二是不要采取非法手段去牟利,三是应该确保大数据的利用是在绝对安全的前提之下,或者最大限度的安全之下。第三,大数据要有公众监督,不能暗箱操作,要有透明性。”
我之所以持有这样的观点,是因为这几个问题是目前外界对大数据比较关注但也很容易被忽视的问题。目前,人们纠结于利用或不利用大数据,却忽略了怎么用,怎么好好的用,怎么用好。虽然目前大数据还没有做到真正的商业化,但之前一些关于大数据的“警报”却必须引起我们的重视,比如社保信息泄露,比如某些电商的信息泄露等等。
对于我的问题,以及这几个观点,笔者向大数据解决方案提供商成都数之联科技CEO周涛请教。周涛是这样回答我的。
关于大数据本身,他认为,“大数据”是“数据化”趋势下的必然产物。数据化最核心的理念是:“一切都被记录,一切都被数字化”。
对于这个观点,我是赞同的,因为这就是大数据的本质。“天空没有留下翅膀的痕迹,但我已经飞过”,这只是诗歌,不是现实。
对于如何从大数据上获取价值,周涛认为:“对此,我们要做得是1,解决‘信息过载’的问题,即通过自动化、规模化的方式为每一个用户找到他感兴趣或者需要的信息;2、从非结构化的数据中挖掘出价值,甚至在尽可能少损失有价值信息的前提下将其结构化;3、在数据隐私和安全得以保障的前提下,从关联的数据中挖掘出‘一加一远大于二’的价值。”
周涛的观点,应该是从企业角度来说的。按我理解,应该是这样三个应用步骤:“一,如何提取大数据;二,如何优化大数据;三,如何合理利用大数据。”说的虽然简单,但很清晰。尤其是“一加一远大于二”的说法,很有启发性。
不过,对此我还有几点疑问:“第一,提取大数据的方法有了,但大数据的主人是否愿意让企业提取呢?比如,我购买商品,留下了我的信息、地址甚至电话,这些我是不愿意让别人提取的。第二,大数据优化的过程中,有价值的信息留下了,但那些在商家眼里无价值的信息怎么处理?一旦所谓无价值的信息被遗弃,最终落入别有用心的人手里,那会怎么样呢?”同时,我还有一个宽泛一点的问题,大数据的安全该如何保证呢?
真正的物联网时代还没有到来,但已经近在咫尺,大数据公司该如何从大数据上获取价值,这是个必须要思考的问题。对于我的问题和忧虑,我很希望周涛或者是其他的行业人士能给我一个解答。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06