京公网安备 11010802034615号
经营许可证编号:京B2-20210330
长夜漫漫,无心睡眠,我以为只有我睡不着,原来晶晶姑娘你也睡不着!请问你也是春运没买到坐票吗?
每年的这个时候,总会流传着一张图片,那就是非洲的角马大迁徙和春运盛况的对比图,隐含的意思无非就是说“雨季又过了,又到了春运的季节,男男女女们挤在一起,随着列车轻轻的摇动,就如同那雄海龟趴在雌海龟的身上……”
所以当百度推出的春运迁徙地图在央视亮相的时候,马上让我眼前一亮。作为这种大数据可视化产品的脑残粉,一定要跳出来赞一下。
一.迁徙地图背后的大数据可视化
从全国迁徙图首页可以看出,数据来源是百度地图LBS开放平台,并且辗转找到此项目的负责人求证后,也验证了这一产品的数据来自于众多使用了百度地图的应用所传送来的定位请求,从而对所有请求信息进行辨认设备和定位位置变化来分析处理全样数据。
上面的话比较拗口,简单点儿说,就是只要你的手机里装有使用百度地图API的应用,那么你的长距离移动就是这张地图里的一条线。
只拿此刻的数据进行一下解读,1月26日上午十点,在过去八小时内最热的迁入城市前三名是北京重庆和赣州。无论重庆和赣州,都是劳务输出的重点地区,排名前三理所应当。那么北京为什么位居迁入城市第一?
点开北京的路线详情就能看到,迁入北京的大部分是廊坊、天津、葫芦岛等地的人,只是把北京当做一个交通中转站而已。这也就是北京能在迁出城市和迁入城市都能名列第一的原因了。
已经看到有人质疑这种产品有什么作用。在我看来,再牛逼的大数据挖掘技术,如果不能以一个接地气的方式表达出来,那么永远就只能停留在拙劣的公关PR稿中。举一个最浅显的例子,如果铁道部看完这个图,那么他们至少知道下一步的高铁线路应该怎么铺设。如果你是那个在火车上卖WIFI的小哥,你肯定也会选择最热线路吧?卖烧不坏的袜子、越南跌打膏之类的朋友们同理。
前两天,陌陌也推出了他们春运版的数据,盘点了热门回家线路热门群组各种数据。但是看完之后,我陷入了深深的失望,我最盼望的数据是“漂亮妹子最多的线路”“漂亮妹子最多的车厢”“D杯以上无座只好站着的漂亮妹子最多的车次”……
二.称赞与吐槽
一直以来,百度是我心目中人格最分裂的公司,A面是一个善于营销和自我推广的公司,但是最近几年推出的新产品基本都是跟随型产品,别人先蹚出一条血路,然后百度再用自己庞大的用户群和流量去拓宽这条路,包括踩死先行者。B面是一个拥有着众多牛人和牛逼数据的GEEK,但是却不拿这些数据来做一些让人拍案叫绝的东西。
如果想成为谷歌一样受到全世界尊重的搜索公司,那么百度必须要做一些让人惊叹的产品。例如2008年前,谷歌推出了一个单独的小产品--流感疫情地图,里面将从世界各国卫生组织收集到的流感信息用可视化的方式呈现出来,这样你在出差的时候,就知道是否应该带药品了。(嗯,根据地图显示,我国人民身体素质很好,身体倍棒吃嘛嘛香不得感冒)。
从表面上看,这产品对谷歌商业化产品没有任何拉动作用,但是经过这样的尝试,在两年后,当H1N1病毒肆虐的时候,谷歌已经能将患病高发区整合进自己的地图应用了。
百度迁徙地图算是百度近年来比较少见的,不以拉动任何产品下载使用为目的的数据产品了。但是就产品细节来说,有不少地方有待改进,例如视觉的炫酷感,例如地图的可点击操作等等。
无独有偶,就在五天前,英国《卫报》推出了他们的一个数据产品,叫做《在天上--航空的百年史》。因为1914年是世界上首个商业航班试飞成功,当时只有1名乘客。1914年全年也只卖了1205张票,而2013年卖了31亿2千万张飞机票。产品首页就实时展示了现在全世界上空正在飞行的飞机数和过去24小时所飞过的航线图,很炫很酷,并且密集恐惧症患者慎入。(地址,可能需要翻一下~)
三.大数据需要更接地气
大数据,要玩起来,才会更好玩。我们经常会在公关PR稿中看到这样的话“在本次发布会上推出的新版本,是基于大数据,由业内资深的大数据挖掘团队和机器学习团队埋头研究数月才推出的……”让人不明觉厉。同样的句式,放之四海而皆准,例如情趣用品,也可以说“我们这次推出的新的按摩棒,是基于大数据,由业内资深大数据挖掘团队和机器学习团队埋头研究数月才推出,完全符合绝大多数中国女性的使用习惯……”
所以,大数据现在需要的是将一个泛概念变成一个个接地气的产品或者项目。例如美国梅西百货,他们会根据库存和需求变化情况,实时的调整7300万种商品的实时定价。例如洛杉矶警局,会根据各个区域之前的犯罪率和居住情况,预测性的调整巡逻频率和力度。
百度迁徙地图,如今只是刚上线,所以更多起到的是公关和宣传的作用。而如果这个产品能坚持10年,那么这一定是了解中国产业结构变化和人群生态变化的最简单的途径。
打住,写到这里,突然觉得上面的文字正经到了可怕的地步。
我终于在过年回家之前,把自己的状态调整到了一个六线城市里的木讷内向男中年,准备在“瓜子花生矿泉水,鸡腿盒饭收收腿”的亲切乡音中要变身成地图上的一条线了……
|
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10