京公网安备 11010802034615号
经营许可证编号:京B2-20210330
几个奇葩例子让你深度认识大数据
因为大数据,我们的生活是否变得更舒适?亦或,从此我们的生活细节都要暴露在数据的分析之下?我们该如何正确认识大数据?现在,先让我们了解一些真实的大数据的例子。
大数据早已成了我们耳熟能详的词汇,大数据也逐渐得到的政府,企业和个人的重视。基于此,大数据究竟在如何影响着我们的生活?
大数据(Big data)
因为他,我们的生活是否变得更舒适?亦或,从此我们的生活细节都要暴露在数据的分析之下?我们该如何正确认识大数据?现在,先让我们了解一些真实的大数据的例子。
从地球到月球的距离
如果我们将一天内产生的数据全部烧录进DVD光碟内,那这些光碟叠起来可以搭成地表到月球的DVD高塔,而且还是双塔。
大数据与星星
根据IDC的分析,2008年时数码数据量就超过了目前已知的宇宙内星星数量,而且以数据成长的速度,2023年时全球数据量将会超过亚佛加厥常数(Avogadro's number)--也就是6.022×10^23。
亚佛加厥常数
男性内裤销量反映经济形势
已故美联储前主席格林斯潘(Alan Greenspan)曾提出过一个著名的"男性内裤销量反映经济形势"的理论。即经济形势良好,内裤销量会平稳上升,反之则下降。
原因很简单,经济萧条时,男性会节俭开支,少买内裤。。。
啤酒与尿布
这是个经典的商场数据分析案例。在上世纪90年代,美国沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,"啤酒"与"尿布"两件看上去毫无关系的商品会经常出现在同一个购物篮中。
啤酒与尿布
在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。
女性头发与经济波动
据日本最大日用品制造公司"花王",于1987年开始在东京银座对1000名,二十至三十岁女性进行的年度民调后汇编的"发型统计"显示,他们偏好蓄长发时显示经济在复苏中,反之则经济仍在恶化。
比如,1997年,留短发的比蓄长发的人多,那年为日本经济"最差"的一年,2008年经济有所起色,超过八成受访女性头发都很长。
手纸与肥皂
双十一海报
前年“双十一”(11.11)这一天,京东商城卖出了80万块香皂,重量约115吨,相当于23头大象;基情无限的同时,手纸卖出900万卷,8亿多抽手纸,按一秒钟扯一抽的话,至少要扯3年,按一卷纸30米算,900万卷至少可绕地球7圈。
处女座与小龙虾
根据"首届小龙虾美食节"的"小云WiFi美食大数据"显示,女性对美食喜欢程度超过男性,66%的女性喜欢吃小龙虾;而在年龄统计中发现,20-25岁的美食达人最多,处女座是所有星座中最爱食用小龙虾的人群。
一位美食大V不无严肃的认为,从一个侧面说明现在商家的小龙虾的制作工艺、烹饪方式已经达到了一定的高水准,"毕竟处女座的追毛求疵的性格是不争的事实"。
女服务员与股市
在这个刷脸的时代,容貌早已成了求职的隐形标准(不过凤姐当上凤凰客户端主笔,理当另说)。据纽约观察员的解读,当美艳的女服务员随店可见时,经济必陷困境,反之则显示经济兴旺,换句话说,当你到处碰见美女服务员,便可考虑抛售股票。
服务员与股市
该观察员的解释是,当经济红火,颇有点"资本"的女性很容易找到工作环境舒适的工作,诸如商品模特、推销员等。此外,男性经济宽裕后也更容易"金屋藏娇"。
大数据遇到爱情
美国波士顿数学家克里斯·麦金利(Chris McKinlay)注册一个婚恋网站后,认为他们的配对模式不合适,于是他自己写程序,只花了不到90天时间就在茫茫人海中找到了心仪的对象。
这位克里斯开设了12个账户,利用计算机程序随意作答网站的配对问卷,从2万名用户中收集到600万条问题的答案,然后利用演算程序筛选出5000名住在美国的活跃用户,从中按性格分类又选出最符合择偶条件的2组女子。
之后克里斯又创建了两个账号,诚实地回答这两类姑娘们最关注的500个问题。回答完问题后,他发现和自己匹配度在90%以上的超过10000人,最高匹配度达到了99%。
克里斯·麦金利
为了获得这些姑娘们的关注。克里斯编了一个新程序,自动访问与他匹配度高的对象,对方回访他的页面时,就会给他留言。
在经过不少尝试后,克里斯终于约到一名亚裔女孩。他见面时主动披露破解网站的秘诀,对方极为欣赏,二人开始恋爱关系。并在恋爱一周年后克里斯求婚成功,二人终成眷属。如此"用心",也是醉了。
食色性也 "看完速7,去速8"
《速度与激情7》
食色性也:凡是人的生命,不离两件大事:饮食、男女。《速度与激情7》上映时,"看完速7,去速8"一度成为相互调侃的流行语。而日前,猫眼电影整合了2015年上半年的售票数据,做了一个有意思的数据报告。报告根据用户购买电影票的习惯,结合用户在美团上的相关消费行为,发现了有意思的现象。
数据显示,用户在购买电影票的同时,有79%会进行餐饮消费,10%会选择唱K、桌游、足疗等休闲活动,还有11%会选择酒店消费。注意噢,酒店消费里,有81%选择的是"速8"一类的经济型酒店……
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20在商业数据分析领域,“懂理论、会工具”只是入门门槛,真正的核心竞争力在于“实践落地能力”——很多分析师能写出规范的SQL、 ...
2025-11-20在数据可视化领域,树状图(Tree Diagram)是呈现层级结构数据的核心工具——无论是电商商品分类、企业组织架构,还是数据挖掘中 ...
2025-11-17核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序 ...
2025-11-17在数据驱动成为企业核心竞争力的今天,很多企业陷入“数据多但用不好”的困境:营销部门要做用户转化分析却拿不到精准数据,运营 ...
2025-11-17在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12