
大数据浪潮:打破电商信息孤岛的边界
大数据的精髓并不仅仅在于数据量大,或者是数据品类多,而是流动和变化。
那些坐拥庞大数据、认为可以利用手里的数据资源还原用户本来面貌的企业,或许还停留在大数据1.0的时代里。
在前沿数据研究机构看来,真正的大数据浪潮,应该让人类历史上第一次有机会把不同类型、来自不同地方的数据围绕着一个东西形成一个完整的描述。当一个人、一个商品、一个地方被打上500个标签,仅靠一家企业掌握的孤立数据是无法驱动的。
在未来阶段,企业需要依靠外化的数据去制定战略、作出决策,或者预测销售。大数据更像一个水池,或者一棵大树,在上面长出非常伟大的数据产品,所有人都可以摘下来品尝。
数据不流动 企业变孤岛
百分点COO张韶峰认为,企业数据必须要流动才能产生价值,而静止数据只是看上去宝贵,实则敝帚自珍,最终数据也将被时间淘汰。
“这个行业已经变化了。”张韶峰回忆道,自己浸润数据挖掘、商业智能、决策支持系统十年,前半段职业生涯主要为传统行业服务,包括线下零售,包括金融、电信运营商,“那时候我做企业级数据仓库,我只能帮助客户整合企业内部的数据。所以我客户的老板们他只能基于他企业内部的数据进行决策,他没有别的办法。”
割裂的、孤立的、静态的数据反而让企业陷入信息的孤岛。在何种情况下,企业决策者在作出判断时,响应周期是缓慢的,一个决策通常要耗时一天甚至更多。这对于变化迅疾的零售企业,尤其是电商行业而言,节奏显然不足以匹配。
“在互联网时代,企业跟企业之间已经连成一片了。如果你的数据不流动,你的企业自己就是一个信息孤岛。每个企业都在严重的浪费自己的数据资源,当互联网大潮来临的时候,可能每个企业你那一个小的天地会被冲垮,你会瞬间崩塌。”张韶峰坦言。
实际上,亿邦动力网此前同一些电商企业负责人交流时就曾发现,在这些分属于不同行业的电商企业之间,实际上已经存在数据流动或者置换的意愿。
某生鲜B2C电商副总裁指出,电商在切入新领域时,作为新生力量,体量尚小的阶段,不同企业之间进行用户数据分享和交换尤为重要,对于精准的获取用户也更加有效。“单独一个公司的数据是不能把所有用户行为分析清楚的,与其独享,不如把小数据开放,拿出去交换。”
在电商领域,最懂得用交叉数据驱动精准营销的非亚马逊莫属。它的那些根据验孕棒、防辐射服的购买数据,去制定奶粉营销计划的经典案例,已经证明了大数据分析一定是基于各个领域的小数据交织、共享下完成的。
只不过亚马逊用它的方式证明了,数据不仅仅可以在同一个时间维度里交叉使用,即便是有跨度的时间里,也可以通过别人的历史数据来预测自身未来阶段的销售行为,从而将各个数据孤岛进行关联。
数据“外脑”时代到来
打破信息孤岛的边界,让内外部数据合纵连横,这并不仅是“百分点科技”的看法。实际上在埃森哲——这家全球知名的咨询公司看来,同样认为,如果能够结合企业内外部的数据源,大规模的个性化服务在互联网时代是可以实现的。“如果企业能够把握住消费者在消费前后各个环节的信息,就将领先于其他企业。”(引自2013年技术展望报告)
埃森哲的报告里面曾指出,Web2.0的时代,企业内部数据的权重要远远超过外部数据;但是当Web3.0到来的时候,数据就会真正流通起来,企业外部数据的权重会越来越高。
“究竟这个时间段几年的时间我们很难预测出来。但是我们看到这个趋势,就是大数据真正能够给社会带来价值,在于数据能够流动起来,在于外部数据占的权重会越来越重要。”百分点联合创始人苏萌向亿邦动力网表示。
显然,同一个行业数据的扩展是加法效应,而不同行业数据的扩展是则是乘法。这可能就是百分点想要成就的事情,做企业的“外脑”。基于此,百分点不仅仅满足于为企业提供更多的互联网数据,而是开始向线下,以及更多横向的、正在历经被互联网改造的领域,去开凿新的大数据,譬如金融、汽车、房产、传统零售等。
百分点试图挖掘出一个庞大的、线上线下融会贯通的数据池,从而让更多的数据流转起来,然后再从中调用有效的、多维的数据,输出给企业主进行预测、分析、决策。
关于数据流动,百分点CTO周涛提供了一个形象的比喻:“比如一杯水,我们可以在各个不同的方向拍照,可以看到它的侧面,大概知道这是一杯水,但是不能完全重构它。同样,如果有一个人,我可能知道他的一些资讯,另外一个人可能知道他购物的信息,再一群人知道他微博的信息,然后从侧面给他拍照,利用这些信息,就能从某种意义上重构这个人。当然,这个他和真实的他不完全一致,但是又有很大一部分是重合的。”
再比如沃尔玛和宝洁,一个是非常了解消费者在线下店里购买行为的传统连锁零售巨头,一个是掌握消费者偏好的品牌,他们从不同的角度去搜集消费者的数据。但这还远远不够,如果将这些数据和汽车生产制造商,乃至上下游企业共享一些数据,就会让这个链条中不同的企业对于数据、消费者有更深刻的洞察,从而通过多维数据来提高运营效率。
而百分点攫取的正式数据供应链当中的价值。“你找矿的时候如果挖得比较慢我们提供工具,如果你需要更多的数据源我们帮助你去找,我们帮你整理用户的标签,帮你整理商品标签,甚至加工成你的行业特殊的商品。”
电商会为此买账吗?
数据流转的概念给了数据研究公司、互联网企业、传统零售商更多兴奋的理由,但是,他们是否会为此埋单?
显然,“大数据”从过去的空中楼阁变成了而今行业圈子茶余饭后的谈资。当每个人都在热议大数据的时候,其本身的价值是否正在被消解?
用IDG合伙人李丰的话来说,大家看不清楚大数据最大的一个原因,是虽然嘴上都在谈论,但却好似十几岁的小朋友在谈论男女之间的问题如出一辙,“大家其实没有搞清楚里面的事情”。
这为数据研究公司带来的难题则是,如何让更多的企业明白大数据重要性的同时,知道如何更好的运用大数据,将自己的数据分享出来。
为此,百分点将自己的推广策略定位为“产品即营销”,用产品和技术去驱动企业与数据的全面接触。
“我觉得早期其实我们向客户推广遇到大的问题就是,大家说你告诉我能帮我赚多少钱,你能给我带来什么效果?”百分点联合创始人苏萌表示,现在越来越多的企业,希望通过底层的数据管理,能够接到更多落地的一些应用,但往往这些数据分析公司在落地应用上存在不足,“描绘一个非常好的前景,但是最后没有应用落地。”
那些在大数据浪潮之中被淹没掉的数据公司,只能授人以鱼,但这远远不够。让企业认识到数据流通的重要性,就必须为企业提供更实在的工具,并让他们见到效果,尤其是对分分钟都是真金白银的电商而言。
为此,百分点方面今年建立了以大数据管理平台为中心,覆盖社交媒体、移动终端、内容网络等多源异构的用户偏好数据库。同时,运用云服务平台,提供包括大数据应用、运营决策分析、商品销售预测、服饰行业应用等在内的一系列“分析即服务”型产品;并通过开放数据平台,消除大数据在企业间的“孤岛效应”,实现大数据在企业内外部的流转与交叉复用。
“在推动数据的流动的过程中,总要有人站出来,把自己的技术出来能力和处理的方式提供给更多的人,并且以相对合理和低廉的方式提供给更多的人,才能够在这一个点上促进数据的流动,才能实现每一个点上个性化的价值。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29