京公网安备 11010802034615号
经营许可证编号:京B2-20210330
O2O的大数据金矿应以什么姿势挖掘
首先我们先来分清数据在商业社会中产生的两端,一端是TO B端,也就是商家端,这个部分在银行表现有企业的存贷等数据;零售业则是商品属性、进价、商家类型等数据。说白了,就是和商家相关的数据;另一端是TO C端,也就是个人端,这个部分在银行表现为个人存贷数据;零售业则是销售、顾客在卖场的动线、会员卡信息等数据。说白了,就是和个人相关的数据。
数据演变的第一阶段:静态数据
在线下的商业时代,也就是我们说的传统企业,数据的第一阶段属于静态数据,怎么理解呢?
就是说你办了张信用卡或者实体店的会员卡,初次登记的信息没办法随时由你个人来改动,这个数 据如果你不打电话去银行或者到实体店,或者他们不联系你时,一直是不会变动的,哪怕你已经换了无数次手机号搬了无数次家,信用卡和会员卡仍然在有效期内可 以使用,这种情况现在已经有很大变化,但仍然是静态数据。而线下的许多动态数据,例如在店里走过来走过去、眼睛看这看那等,原来的技术能力无法获取这些数 据。
数据演变的第二阶段:相对动态数据
在线上的商业时代,也就是我们说的PC电商,数据的第二阶段开始了,那就是相对动态数据,为什么说是相对动态呢?
你在电商网站注册了用户名和密码,你的浏览、点击等这些数据被记录,并可以随时根据你的变化 而变化,这些数据实际上也是相对动态,因为数据和个人及最终销售的关联度有限,而且数据量有限,因为无法对接离开电脑后的数据;然后你产生了购买行为,如 果你的地址和联系方式信息不自行调整,这些电商网站会按照这样的信息进行送货,这种情况现在都会发生。
所以数据需要你手工进行修改,这样的数据就是相对动态数据。这样的数据量一方面是量有限,一 方面是价值有限,最终胜出的并不是烧钱推广的网站,而是构建基础电商服务体系的两个公司,一是构建了在线金融优势的阿里巴巴的支付宝,解决了在线支付;二 是构建了物流优势的京东,解决了快速送货和售后服务。
PC时代产生的许多数据,除了电商外,其它的游戏、门户、商业服务基本都是这样的相关动态形态。傻傻地认为电商要发展起来砸钱买流量的基本都挂了,无一幸免,很有可能是对于数据与商业基础服务关联思考和实践得不足导致,其它原因不再过多赘述!
数据演变的第三阶段:动态数据
到了移动互联网或者再进一步移动社交互联网时代,数据进入到第三阶段,那就是动态数据。
说到这个部分就很好理解了,你的手机可以随时定位你的具体位置,就是你不修改保存的地址平台 都能够知道你的位置精确变化,还有你的浏览轨迹从线上到线下都被跟踪和获取……数据量以几何级开始增长,价值变得越来越高,O2O(线上线下结合)的大数 据时代来临,个人和商家所谓的隐私数据越来越多被各种各样的智能机器获取,人力已经无法HOLD住自己的隐私数据,这个我在2012底年就写过一篇 《O2O的世界没有隐私》的分析文章。
不过话说回来,在这样的大数据时代下,实际上对于轻易能够获取数据的任何一家公司来说,个人 和商家的隐私保护显然担子更重了,因为一旦这些隐私数据被泄露,对于一家公司来说很多时候直接倒闭,无法再次获得信任,这也解释了为什么现在数据安全和攻 击比之前两个时代要多得多的缘故。
非常简单地描述了到现在为止数据演变的三个阶段,当然在“商性研究院”对数据的研究里,还有一个即将来临的阶段应该叫做:超动态数据。
超动态数据
这个阶段的数据到了生物层面,随着智能设备和人类在物质极大丰富后对健康的重视,可能植入设 备不会到来,但是能够通过各种光线探测人类生物数据的智能设备会快速发展并成为日常使用的工具,例如通过增加光线检测的空调能够直接测试人的体温和环境温 度的数据,这些数据再和其它设备产生的热量关联,智能调节温度;戴的手表金属接触皮肤后检测细胞状态获得数据;红外摄影头感应热度数据等等很快会成为可 能,这时候生物数据的快速变化(人的体温变化估计要用毫秒来进行)就使得数据进入到“超动态数据”阶段了。
“那么,大数据金矿应以什么姿势挖掘?”
第一阶段的静态数据结合得让人恼火,简单说大家会有感性认识,你每天收到的垃圾短信、诈骗电 话、推销电话等行为都是这些静态数据被简单粗暴“出卖”的数据金矿挖掘姿势,别说个人非常不爽,其实像电信三巨头和金融业、房地产、4S店、零售企业等这 些拥有在数据第一阶段拥有算是海量的个人和商家静态数据的公司这种金矿挖掘姿势也显得有些无奈,明知大家都不爽,为什么都做?这个话题聊下去估计要上升到 哲学高度,就多扯了,总之金矿挖得很苦,个人骂平台,平台假装没听见或者装无辜……
这个阶段很快被第二阶段的数据挖掘姿势取代,虽然有少量行为,但变得少很多,阿里和京东并不需要将相对动态数据以这种方式变现,而是开始建立数据分析模型和产品,以产品化、工具化和平台化三种方式更有效率且更高收益地挖掘数据金矿。
简单地说:通过相对动态数据就可以知道什么商品更好卖,这个指导着京东这种采销体系的平台进行采购和营销,就比苏宁和国美效率高且数据产生的收益大,再进一步推动的金融创新:京东白条、京东金融让数据收益开始更高效率更低成本地从零售业跨界到金融业。
阿里做得更加极致,除了比京东更早的金融创新之外,还有开发了数据魔方这样数据产品,商家可 以通过付年费方式获取更多数据指导自己的商业行为;还有服务平台的建立,也使得数据进一步在产品和工具开发上获得发展,从而获取收益。这些方面是开放平台 的思路,商家通过平台的个人数据和工具提升效率提高销售降低成本,愿意为数据付费;个人通过数据服务平台了解自己的消费情况,更理性地消费和引导到理财平 台,为后面的动态数据阶段打下了坚实的金矿挖掘基础。
这个时候的银行业、金融业、汽车业、房地产业、零售业面对着自己的数据金矿开始显现出无奈和 无力的一面,只好开始向互联网平台学习,积极寻求两个方面的数据演变:一是数据转化,让静态数据不断转化成相对动态数据;二是通过产品和工具为商家和个人 提供服务,从而愿意为数据付费。但似乎又不愿意放弃之前的数据金矿挖掘方式(有很多企业实际上从来没有挖掘过数据金矿),所以演变得很慢,开始出现暴力开 采导致的带大量金子的沙子流失,这就是“数据迁移”现象。
这个现象很可怕,商家的人力、资金开始不断像线上的平台倾斜,线下的媒体首先受影响,然后是实体店的销售受影响。不过由于在相对动态数据的第二阶段,由于线下数据和线上数据的分离,影响并不那么深远!
第三阶段的动态数据是在硬件技术引发量变的基础上发展起来的,原来PC时代挖掘金矿能力相对 较弱的腾讯借助移动技术优势反而变成最强的一家,一个小小的红包产品在TO C(个人端)引发的数据挖掘方式至今无人可以抗衡,而且已经持续了两年多,每月红包未提现金额的资金沉淀非常惊人;并且在春节的联合商家的红包营销让我们 看到形成了上百年的广告投放和盈利模式被颠覆,广告费直接以红包形式到了个人用户,然后再和商家的公众号进行联接,构建商家和用户关系持续免费营销!
同时借助几乎属于永不退出的微信账号产生的朋友圈位置和动态数据、聊天数据、附近的人调动的 位置数据、第三方应用产生的数据等等开始深度和线下商业结合,一个朋友圈的推广广告产品不仅没有让人反感,反而引发:为什么我没有收到宝马广告这样的二次 营销扩散,每次收到朋友圈推广的人们各种开心各种欢乐评论;商家通过这些数据获得品牌推广和销售增长的机会,平台获得巨额的广告收益。
金融创新的数据挖掘方式在这样的动态数据阶段得到新的爆发,可以说如果不是对传统金融业的有限保护,毫不夸张地说,余额宝这样通过大数据挖掘演变出来的产品会像刚才提到的商家红包一样颠覆金融业在个人领域的盈利模式!
还有一个我所知道的大数据金矿挖掘姿势来自亚马逊的大数据系统给沃尔玛美国和中国的部署基本 实现了全面的智能采购,简单点说就是将全球沃尔玛线下实体店的商家和个人消费数据输入这样的系统,通过算法可以实现不需要人工再分析的采购订单,然后直接 发给供应商订单,然后再配送到店!这方面在努力的公司还有谷歌、百度、FACEBOOK、特斯拉、阿里、华为等等。
如果再深入研究和学习下去,我们就可以发现第三阶段动态数据进化来的大数据金矿能够用很多种 商家和个人都很爽的姿势挖出来,收益是前两个阶段的总和还要高几个几何级。这个部分欢迎大家加我个人微信公众号:izhuangshuai持续关注和交 流,想更深度一起研究,欢迎支付底部的年费后加入“商性研究院”。
这样的大数据金矿挖掘姿势显然比第一阶段和第二阶段都要爽很多、高效很多,收益曾几何级增长 并且帮助到更多商家更有效率更自动化地实现销售增长和利润增长,如果进入到第四个阶段:超动态数据!所有零售系统、生产系统、物流系统和金融系统和人们的 几乎所有数据关联,生产和销售就会变得无须人力,真正进入到“物质极大丰富”的时代,这个时代70后在有生之年应该可以见证了……
这样的发展也再次印证了我的第一本新书《商性》的中心思想:商业越发达越能激发人的真诚和善良!在物质极大丰富之后的人们,在所有隐私数据(包括生物数据)都被获取、存储和关联到人、物的阶段时,我们确实没有理由不变得真诚和善良了!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25