京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据能基于你的邮编猜出你是什么人_数据分析师
大数据时代,你的邮编就是一个窗口,通过它可以了解你的消费能力。这个窗口同时也显示了你消耗时间的方式; 因此,它实质上揭示了你是怎样的一个人。
以上是Esri软件公司所述。该公司将全美国的邮政编号标图,并将它们与美国市场区隔的67种概貌之一相关联。比如,Esri对住在邮编90210(比弗利山庄)的人,也就是属于“顶级”概貌的人们是这样描述的:
“我们已经完成了在企业中的职业目标,现在我们可以商议或运作我们自己的生意事业。我们已婚,小孩已经长大,或没有小孩。在我们奢华的家中,每一项家居维护的杂务都签约给各种服务商负责。我们可以在顶级的沙龙、SPA、健身中心充分享受各种私人服务,我们在高端商户选购任何想要的东西。我们经常旅行;豪华又舒适的度假,或者去我们在美国或国外的第二个家住一住,不惜花费。我们的夜晚和周末被戏剧、古典音乐会、慈善晚宴和购物填满。我们支持艺术和其他慈善活动,我们阅读以扩展知识,我们依赖网络、电台和新闻报纸获得资讯。花时间和家人以及小圈子的密友相处是我们最重要的事之一。“
细节之丰富,令人瞩目。当我把自己以往几个居住地的情况与相应邮编的概貌对照之后,发现这些细节其实也是相当准确的。任何人都可以将一个邮编插入到ESRI的数据库中,这也引发了一个令人欲罢不能的游戏-”猜猜我的身份“。这个数据库同时也可以观察到一些区域是如何逐步从一个邮编转变到另一个邮编的。(比如,帕罗奥图的94301邮政区拥有”顶级“住户的比例比旁边的94303区要高出非常多)
但是不仅如此,这个数据库的迷人之处还在于它可以一瞥市场营销者是如何看世界的,以及数据文件如何或是否关联到偏远城市的居民。虽然像波特兰、俄勒冈、德州奥斯汀这样的城市在文化上有可比性,但他们的市场营销概貌却大有不同。尽管比弗利山庄绝大部分消费者概貌与费城干线区的消费者相同,可是他们与同样消费昂贵的曼哈顿上东区居民的概貌却又是不匹配的。
以下是对11222布鲁克林绿点区的“潮流引领者们“的评论:
“相信‘你只能年轻一次’,我们充实地生活着,不为买房买车所束缚,也没准备要定下来。我们年轻、单身、受过教育、工作好;我们将收入随心花费在高档的城市生活和娱乐中-大部分花在房租上。虽然我们开销很大,但我们也会咨询财务建议并且正在建立投资组合。我们从头到脚的着装都是当下最新潮流;我们工作日的晚上和周末都用于发现本地艺术和文化、在外就餐、或者发掘新的兴趣爱好。我们必须无时无刻不相联;短信和社交媒体对我们的沟通和社交生活是基本的。一切都最好在电子书和平板设备上阅读,当然女性时尚杂志和美食杂志必须是纸版的。我们在Whole Foods 和乔氏购买便捷的有机食物。“
96816,檀香山昂贵的卡哈拉住宅区,“太平洋高地”居民们:
“你会在加州、夏威夷、和东北区太平洋沿海岸大都市区域的城市外围找到我们。我们之中很多是亚洲人和多种族人;我们许多人在国外出生的。我们富有,受过良好教育,已婚,有的有小孩,有的没有。我们有些人几世同堂住在一起。我们拥有昂贵的别墅和排屋。我们是商业、计算机、建筑、和工程领域的白领,我们精明地投资理财;这些为我们提供收入和资产。购物方面,我们去商店买时髦衣服,去好市多购买散装商品,去专门的市场购买食物。我们经常上网,在网上访问博客和聊天室、购物、观看电视电影、操作和跟进交易投资。作为娱乐项目,我们会去赌场赌博、参观主题公园、在家庭餐馆用餐、听新世纪音乐和爵士乐,读时尚杂志。“
49544, 占密西根州大溪地人口总数1/4的“不安的年轻”居民概貌:
“我们是千禧世代,这是我们展现自己的时代。我们年轻、多元、受过良好教育;我们要么在给自己的班级赞助投资,要么在专业/职业销售岗位工作,或者担任办公室行政支持的岗位。我们大多数人租房住,住处随工作地点搬迁。我们住在南区、西区、中西区大都市住户密集区,独租或合租。我们不能没有手机;我们发信息、听音乐、付账单、兑换优惠券、获得指引、研究财经资讯。不忠实于某个品牌;我们购物追求最优的价格。我们买天然或有机食品,但也会吃快餐。我们希望自己是第一个炫耀最新电子产品的人,但我们购买之前会阅读网上的评论。我们上网的时候,用网银、在eBay购物、玩推特和脸书、看电视电影。“
10014,曼哈顿西村的“笔记本电脑和拿铁”一族:
“我们有钱、受良好教育、单身或有伴;我们热爱大城市的生活,在商业、金融、法律、计算机和娱乐行业做专职工作。我们大部分人没有自己的房产或车子,我们在生活便利的区域租住公寓,在家工作或者步行、骑自行车、搭乘公众交通工具活动。我们积蓄养老金而非只顾眼前利益,我们投资共同基金,致力于退休计划。身体健康是最重要的事之一,所以我们定期锻炼,关注饮食营养,在高级商店买有机食品。日常开销花在漂亮衣服、旅行、星巴克享用咖啡、做SPA。笔记本电脑、手机、iPad总是开着,如此保持在联。闲暇时光参观艺术画廊和博物馆;去电影院、看歌剧和摇滚演出;读电子版的书籍报刊,泡吧。”
在全国居民最多元的邮政区95834(加州的北萨克拉门托),有“美国梦想家”; 在全国居民多元性最低的邮政区02562(麻省的沙格莫海滩),有“绿色田野”。奇怪的是,与该数据库中人口普查数据不同,这份数据从未明确提到人种和民族因素-只有一些标签供点击以查看某邮政区收入、年龄、人口密度的更多信息。
这一切说明了消费者的行为在多大程度上影响人们对某一地方及该地居民的认知呢?从市场营销者的视角看,似乎你付钱购买某些东西,你就是某一种人。而如今的市场营销者比以往任何时候都更了解美国消费者的行为。
事实上,美国境内对数据收集没有任何的规定,所以试图获得你行为概貌的人很容易就可以了解你赚多少钱、你的教育程度、你是否拥有房产、你为谁投票、你有几个小孩、你背负多少信用卡债务、甚至是你对《老爸老妈浪漫史》最终集的看法。
美国数据机器触及范围之广,令人震惊。美国联邦贸易委员会今年早期发表的一份报告中认为Datalogix公司(脸书的合作者之一)拥有美国几乎所有家庭的市场营销数据,以及1万亿余消费交易的详细信息。
尽管如此,一个数据代理获得的信息里有多少能跟详请丝毫不差,能等同于真正错综复杂的综合体?毕竟,一份描述是准确的,并不代表这份描述是完整的。真正了解一个地方和它的居民,没有比亲身住在那里更好的办法了。这个事实,至少让人觉得宽慰些。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23