
大数据商机:用户打瞌睡都值钱
关于 “大数据” 这个词,我第一次关注到,是通过一本叫作《大数据时代》(维克托·迈尔-舍恩伯格 / 肯尼思·库克耶著)的书中看到的。
在这本书中,讲到了一个航海地图的故事,大概意思是:一个要去航海的船长,如果他想使用已知的航海导航图,他必须把他在航海过程中获得的新导航信息反馈回来,作为信息的交换。这样的话,越往后面使用航海导航图的船长,所能使用和看到的航海路线就会越充实。
21 世纪商业思维的变迁
这个模式本身(虽然是发生在很多很多年前),放到现在的互联网大数据时代,这就是一个非常有创意的商业活动。
现在的互联网,已经不再是简单的买家和卖家之间的技术对接桥梁,而是更像一种互相可以参与,可以共同发展的一种合作(当然其中还同时存在大量的非合作性的竞争)。
现在很多电子商务平台,以前是以卖实物给个人客户,个人客户用钱财来购买相对应的实物。这是一个单向的过程,其实并没有做到双向的互动。就像航海故事中的一个船长为了得到航海图,付了一笔钱,就拿到了某个版本航海图的使用权一样。随着时间的流逝,卖家并不知道买家下一次有什么样的购买需求。买家也不知道卖家未来会能提供什么实物商品。在买家和卖家之间,有一定的供需不平衡。
一般来说,买家并不希望提供个人的私有信息让卖家知道。其中的原因之一,就有可能是因为买家对于自己的私有信息非常敏感,而又感到如果让卖家知道自己的私有信息,又没有什么可以让他个人赢利的可能,所以这就造成了卖家想获得买家的更多的个人信息,而买家却又不想提供给卖家。
如果换一个角度来想,如果买家肯主动提供自己的个人信息给卖家,那买家多数是认为这样的行为,是可以给自己带来益处的,即像航海故事中的那些船长一样,他们拿到航海图,只需要把自己的航海经历反馈就可以了。那卖家可以提供什么能让买家主动来提供自己的个人信息呢?那多数就是买家想要得到的某种利益。
优秀案例:用户打的瞌睡都值钱
例如,一个做中医养生的公司,如果想让客户提供自己的个人健康方面的信息,比如个人的饮食种类,三餐时间,睡觉时间等。那这家公司就可以通过这些吃喝拉撒睡的信息来为客户进行疾病的预测,一般客户对免费的健康咨询报告总是受欢迎的。
很多人会问,这家公司如何赚钱呢,其实那家公司可以根据所掌握客户的大量数据进行分析,可以从海量的数据中推测出一些有价值的商业数据。
例如从很多客户三餐吃了什么,就可以推测一下,某些食品在某些地方的销售情况,再根据天气预测情况和交通运输状况等,可以估计一下,未来某个地方的这种食品的供应会如何,然后向这些食品的生产企业提供数据咨询服务,告诉食品生产企业哪个地方的这种食品会销售得更加好。
再者,拥有大量人员海量健康数据的公司,可以根据已经推测的预期结果,让某种医药生产厂商来决定是否要扩大或者缩减对抗某种疾病的药品的生产规模,以适应未来的潜在病患的购药需求。
拱卫商业思维的物质基础
计算机硬件的发展也促进了大数据时代的到来。记得在小学时,学校里就只有十几台用 5 英寸启动的 DOS 系统的老电脑,那个时候在上电脑课时,是一个数学老师在教我们用 LOGO 语言来在计算机屏幕上画图。现在的普通的个人电脑的容量已经早过了 G 时代,而且越来越多的年轻人,已经直接跨入到了移动时代——这为大数据时代,各种各样数据的存储和计算提供了物质条件。科技的发展,让二十年前的不可能变成必须。也把老旧的商业模式直接送进了坟墓。
现在在软件世界中,已经有了不少的可支持大数据运算的技术平台(如 TimesTen, Spark, Hana 等等)。在软件服务领域中,金融和电信公司一般对数据的存储和计算在数量上是要比一般的企业要多很多。作为金融行业的从业人员,在文章的末尾,我想给大家推荐一个由中国人组成的团队开发的云计算平台 YunTable。
在结构化数据分析方面,很多公司会选择业界比较成熟的解决方案(例如 Oracle 的 Exadata),但它的价格比较昂贵。对于许多大数据初创型的创业公司而言,这么高的前期硬件投入成本有点难以接受。而对这些创业期的小公司,YunTable 或许是一个可承受的选择。
YunTable 的双赢模式是这样的:YunTable 公司提供方案,在客户的使用过程中,客户也会及时地反馈到 YunTable 公司,公司可以进一步地完善和提升产品的性能,就像航海故事中的不断扩充的航海地图一样。
而对于像 YunTable 这样的软件公司来说,在大数据时代,与客户亲密合作,做互惠互利的事情,也不失为一个很好的商业切入点。
总结
每个人或者企业都有自己的需求,希望得到别人的供给。而每个人或者企业也想通过提供别人需要的供给来产生利润。大数据时代,让很多以前不大可能发生的事情,变得越来越让人有期待。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29