京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析告诉你不一样的中土世界
人口普查对一个国家来说, 是了解居民基本情况的重要手段。 很多国家大约是每十年, 就要花费大量人力物力来进行人口普查。不过, 最近, 一个瑞典的21岁大学生, 却一个人完成了一项全球性的人口普查。 只不过, 普查的对象是托尔金小说的《指环王》系列小说(霍比特人,指环王, 以及精灵之钻)中描述的中土世界。
这位小伙子名叫Emil Johansson, 是瑞典查莫特理工学院的化学工程系的学生。 他在业余时间, 利用了近一年的时间, 在今年11月推出了叫LotrProject项目的网站。 对托尔金小说里的923个人物进行了分析。
通过Emil Johansson, 我们知道了霍比特人的平均寿命是96.24年, 而比尔博.巴金斯活到了131岁, 使他成为仅次于斯米戈尔(也就是咕噜)外最长寿的霍比特人, 而比尔博-巴金斯的一个侄子, 罗索-巴金斯, 则只活了55岁, 是霍比特人里最短寿的。
而你能想象吗, 中土世界里, 女性占总人口的比例只有20%不到, 就算是最英俊的矮人, 可能也只能通过《非诚勿扰》才能找到恋爱对象了。
本质上, LotrProject其实是一个数据可视化项目。 它把托尔金小说里表述的一个巨大而复杂的家谱关系, 通过图表, 地图, 时间轴以及简单文字说明生动地表现了出来。
下面这个图表就是一例, 这个交互式的图, 显示了按照不同种族的寿命分布(精灵因为长生不老, 所以没有列入)。 你可以用鼠标点击不同的部分放大进行更细的信息浏览(本站只是截图, 读者可以去Lotrproject的网站去试试)。
看上去像是数据极客的游戏吧。 不过, 这正是互联网和数据分析神奇的地方, 只要你有想法, 有热情, 技术宅男一样也可以变成明星。 自从推出了Lotrproject网站, Emil Johansson很快就出名了。 他的网站收到了了成千上万的评论, 他还被邀请在古登堡的TED上做演讲。 据说还要去参加明年一月的霍比特人研讨会。
那我们就来看看这个21岁的化学工程系的学生是如何变成网上的明星的吧。
在他的网站里, 他对923个人物做了分析。 尽管这个网站才建立不到一年, 这些想法已经很早就开始了。
Johansson从小就非常喜欢托尔金的作品。 看过无数遍他的小说。 他说, 从2001年起, 他每年都会读一遍指环王。 大约7年前, 他开始根据托尔金的小说《精灵之钻》, 来编撰人物家谱。 最终, 他把托尔金系列小说里的所有人物都作了归类和分析。
Johansson很早就想在网上发表他的研究成果了。 可是他没有什么编程的经验, 所以, 就一直没有付诸实现。 直到他上了大学以后, 他才又重新开始考虑把他的研究上网的项目。
“作为一个工科的学生, 你得知道如何学习新的东西, 去干你过去干不了的事情。” Johansson说:“我不会编程, 不过我Google用得很熟”。 依靠Google, Johansson自学了Javascript 和 PHP, 而最终, 他的中土“人口普查”得以上线。
“起初, 我并没有指望有多少人看它。”但是, 人们最初的反馈好极了。 于是, Johansson决定在家谱的基础上, 添加上交互式的图表, 按照中土世界的大事件加上了时间轴。
于是, 网站变得越来越受欢迎。 以至于Johansson不得不考虑把网站独立托管了。 Johansson又采用了众筹方式, 从Indiegogo上筹资, 2天内就筹到了600美元。 Johansson最近还开发了一个安卓的应用。 一两个月的下载量也超过了1000次。 Johanson说他也想开发一个iOS的版本, 但是那样的话需要一台苹果电脑, 作为一个全职学生, 这超过了他的预算。 不过, 苹果迷们也不要着急。 据说Johansson已经租了一台电脑, 准备在明年一月份前推出iOS版本。
在《指环王》里, 甘道夫在护戒远程出发前对佛罗多说:“当重任轮到我们的时候, 我们需要决定去做什么。” Johansson觉得, 他在花了大量时间和精力进行开发Lotrproject项目的时候, 就有一种来的中土世界的感觉。
“托尔金把中土世界描述的细致入微, 从语言到人物, 都是那么地细致, 当你在做这个项目的时候, 你仿佛就置身于中土世界一样”, Johansson这样描述他的感觉。
听上去太像一个极客了吧。 确实。 “人们不要怕被称为极客, 每个人都有一些狂热的爱好。 比如时尚, 汽车, 托尔金。 化学什么的。 对了, 我其实也很喜欢化学的”, 这个化工系的学生如是说。
除了收到大量的《指环王》系列小说的爱好者的评论外。 Johansson也收到了一些教师的评论。 希望能够授权在教学中使用他的这些图表。 Johnsson本人也在考虑开发一些类似工具。可以采用与Lotrproject类似的方式来表现真实世界的历史时间。 而除了把中土世界搬到网上外, Johansson也计划把另一部魔幻作品《冰与火之歌》的“人口普查”也放到网上去。
而对马上要上映的《霍比特人》的电影, Johansson还在网上放了一张各人物关系图。 Johansson就是通过类似的关系图开始他的家谱绘制的。 而通过这些图谱, 影迷们可以更好的了解各种复杂的人物关系(编者:可能以后的电影营销可以考虑类似的方式了)。
Johansson说:“我的项目取得成功非常幸运, 当我重新审视当初的想法时, 很难想到, 一个纯粹个人爱好竟然能够成为今天这样一个数据可视化的项目。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28