京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据奇葩说:盘点10个有趣的大数据
大数据早已成了我们耳熟能详的词汇,大数据也逐渐得到的政府,企业和个人的重视。基于此,大数据究竟在如何影响着我们的生活?
大数据(Big data)
因为他,我们的生活是否变得更舒适?亦或,从此我们的生活细节都要暴露在数据的分析之下?我们该如何正确认识大数据?现在,先让我们了解一些真实的大数据的例子。
从地球到月球的距离
如果我们将一天内产生的数据全部烧录进DVD光碟内,那这些光碟叠起来可以搭成地表到月球的DVD高塔,而且还是双塔。
大数据与星星
根据IDC的分析,2008年时数码数据量就超过了目前已知的宇宙内星星数量,而且以数据成长的速度,2023年时全球数据量将会超过亚佛加厥常数(Avogadro's number)--也就是6.022×10^23。
亚佛加厥常数
男性内裤销量反映经济形势
已故美联储前主席格林斯潘(Alan Greenspan)曾提出过一个著名的"男性内裤销量反映经济形势"的理论。即经济形势良好,内裤销量会平稳上升,反之则下降。
原因很简单,经济萧条时,男性会节俭开支,少买内裤。。。
啤酒与尿布
这是个经典的商场数据分析案例。在上世纪90年代,美国沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,"啤酒"与"尿布"两件看上去毫无关系的商品会经常出现在同一个购物篮中。
啤酒与尿布
在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。
第2页:女性头发与经济波动,手纸与肥皂
女性头发与经济波动
据日本最大日用品制造公司"花王",于1987年开始在东京银座对1000名,二十至三十岁女性进行的年度民调后汇编的"发型统计"显示,他们偏好蓄长发时显示经济在复苏中,反之则经济仍在恶化。
比如,1997年,留短发的比蓄长发的人多,那年为日本经济"最差"的一年,2008年经济有所起色,超过八成受访女性头发都很长。
手纸与肥皂
双十一海报
去年“双十一”(11.11)这一天,京东商城卖出了80万块香皂,重量约115吨,相当于23头大象;基情无限的同时,手纸卖出900万卷,8亿多抽手纸,按一秒钟扯一抽的话,至少要扯3年,按一卷纸30米算,900万卷至少可绕地球7圈。
处女座与小龙虾
根据"首届小龙虾美食节"的"小云WiFi美食大数据"显示,女性对美食喜欢程度超过男性,66%的女性喜欢吃小龙虾;而在年龄统计中发现,20-25岁的美食达人最多,处女座是所有星座中最爱食用小龙虾的人群。
一位美食大V不无严肃的认为,从一个侧面说明现在商家的小龙虾的制作工艺、烹饪方式已经达到了一定的高水准,"毕竟处女座的追毛求疵的性格是不争的事实"。
女服务员与股市
在这个刷脸的时代,容貌早已成了求职的隐形标准(不过凤姐当上凤凰客户端主笔,理当另说)。据纽约观察员的解读,当美艳的女服务员随店可见时,经济必陷困境,反之则显示经济兴旺,换句话说,当你到处碰见美女服务员,便可考虑抛售股票。
服务员与股市
该观察员的解释是,当经济红火,颇有点"资本"的女性很容易找到工作环境舒适的工作,诸如商品模特、推销员等。此外,男性经济宽裕后也更容易"金屋藏娇"。
大数据遇到爱情
美国波士顿数学家克里斯·麦金利(Chris McKinlay)注册一个婚恋网站后,认为他们的配对模式不合适,于是他自己写程序,只花了不到90天时间就在茫茫人海中找到了心仪的对象。
这位克里斯开设了12个账户,利用计算机程序随意作答网站的配对问卷,从2万名用户中收集到600万条问题的答案,然后利用演算程序筛选出5000名住在美国的活跃用户,从中按性格分类又选出最符合择偶条件的2组女子。
第3页:看完速7,去速8;大数据遇上爱情
之后克里斯又创建了两个账号,诚实地回答这两类姑娘们最关注的500个问题。回答完问题后,他发现和自己匹配度在90%以上的超过10000人,最高匹配度达到了99%。
克里斯·麦金利
为了获得这些姑娘们的关注。克里斯编了一个新程序,自动访问与他匹配度高的对象,对方回访他的页面时,就会给他留言。
在经过不少尝试后,克里斯终于约到一名亚裔女孩。他见面时主动披露破解网站的秘诀,对方极为欣赏,二人开始恋爱关系。并在恋爱一周年后克里斯求婚成功,二人终成眷属。如此"用心",也是醉了。
食色性也 "看完速7,去速8"
《速度与激情7》
食色性也:凡是人的生命,不离两件大事:饮食、男女。《速度与激情7》上映时,"看完速7,去速8"一度成为相互调侃的流行语。而日前,猫眼电影整合了2015年上半年的售票数据,做了一个有意思的数据报告。报告根据用户购买电影票的习惯,结合用户在美团上的相关消费行为,发现了有意思的现象。
数据显示,用户在购买电影票的同时,有79%会进行餐饮消费,10%会选择唱K、桌游、足疗等休闲活动,还有11%会选择酒店消费。注意噢,酒店消费里,有81%选择的是"速8"一类的经济型酒店…
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14