
城市科学大数据与社会物理学如何变革城市的发展_数据分析师培训
共享体验模式与社会纽带模式服从相同的一般规则。对社会网络中的每个人而言都是全新体验的最大的可能性,发生在人们最不常去的地方。去远处探索新想法是最有成效的,日常生活的普通体验则通过在本地社区的参与被升华为社会规范。
托马斯·杰斐逊(Thomas Jefferson)对18世纪的城市有一个著名的描述:“人性堕落的大阴沟。”但是,自杰斐逊时代以来,世界上的城市已经成百倍地增长,而且这种增长并无减弱的趋势。现在,居住在城市中的人口比例是有史以来最高的。既然城市有高昂的生活费用和比生活费用更高的犯罪率、污染程度以及传染病威胁,人们为什么还会持续不断地迁往城市?也许正如亚当·斯密所言:“城市中心既特别堕落又特别创新。”
尽管有关城市的研究已经持续了一个多世纪,我们对于为什么城市能促进创新依然缺乏一个有说服力的模型。城市确实有创新:相比于农村地区,城市更为有效地使用资源,产生更多的专利和发明,人均使用道路和服务更少。是否可以让更多人居住在一起以获得更有效的想法创新和更高的生产率?一些学者指出了技术扩散在创造智力资本中的作用,另一些人则阐述了层次化社会结构和专业化的作用。
专注于想法流而不是商品流
正如前面章节讨论的那样,社会网络互动和想法流是团队和企业里创意产出和生产率的主要推动力。这些社会物理学的概念在社会科学中几乎是仅有的可扩展的概念,并且正如本章要介绍的那样,这些概念完全可以超越小的团队和企业,扩展到城市层面,并通过这些大得多的社会网络促成更高的生产率和更大的创造力。城市和公司一样都是想法机器。
我和潘巍、格拉·戈沙尔 (Gourab Ghoshal)、科科·克鲁姆(CocoKrumme)以及曼纽尔·塞布里安(ManuelCebrian)等学生和同事一起建立了一个数学模型,它基于在面对面距离内的人数来阐述社会纽带如何推动城市里的想法流。正如我们在《自然通讯》(NatureCommunications)的一篇文章中描述的那样,这是一个定量预测GDP和创意产出的简单、自下而上、鲁棒的模型。我们也已经能够说明,沿着社会纽带的想法流可以准确再现城市特征,包括艾滋病毒感染率、电话通信模式、犯罪率和专利权率,等等。它也为我们提供了设计更具创意和效率的城市,尽可能减少犯罪和其他负面因素的研究成果。
值得注意的是,这种从社会物理学的角度看待城市的方法是与传统的阶层和专业化模型不同的。前者专注的是想法流,而不是后者描述的社会的静态分割。这样看来,社会物理学类似于用工厂之间的距离和运输物品的成本等来解释城市制造业有效性的模型。而它们的不同之处在于:社会物理学把城市和公司定位为想法工厂,因此专注于想法的流动而不是物品的流动。
从这个观点看,社会物理学与社会学、地理学和探讨人口密度与创新之间关系的经济学,以及沿着社会纽带进行的传播和创造力研究是一脉相承的。社会物理学新的重要贡献在于把这些想法集成到单一数学模型中,并可用稠密、连续的行为数据以及能够获得的经济和社会结果数据来进行检验。社会纽带和想法流在人类互动模式、移动模式和城市经济特征之间提供了简单的生成链接,无需借助层次化、专业化或类似的社会结构概念。正如本章后续部分要阐述的那样,真
正重要的是想法的流动,而不是阶层或市场。
城市中的社会纽带模式
城市中社会纽带的模式可以通过如下概念描述:两个人之间产生关系的可能性是由“中介机会”(intervening opportunities)的数量决定的。其核心思想很简单:如果你在某群人中有许多“可能认识的人”,那么你与其中某个陌生人建立友谊的可能性就比较小。大卫·利本诺尔(David LibeNowell)及其同事研究了一个日记网站的成员并绘制了他们与朋友和熟人居住距离的信息。他们发现,对于大多数朋友而言,两个人形成社会纽带的可能性与在这两人之间的地点上逗留的人数成反比。
在一个基于位置的社会网络应用Gowalla中发现了类似的关系,Gowalla记录个人及其朋友“签到”的地点。研究人员使用这些数据可以知道朋友之间居住距离的远近,以及朋友们去同一个地点的频率。这一研究得到了一个简单的数学方程,它描述了人们往往会和住在附近的人有较多的社会纽带,并且随着距离的增加,纽带的数量也越来越少。
然而,这一关于社会纽带的数学关系还有其他更为有趣的应用。例如,艾滋病这类疾病的传播显然依赖社会纽带的分布,打电话模式也是如此(当然依赖方式非常不同)。打电话模式作为区县人口的函数和艾滋病的感染率作为每平方英里人口密度的函数,这是两种非常不同的现象。然而,两者都可以用通过分析网站与社会网络所测量的距离与社会纽带数量之间相同的数学关系来预测。
城市中所有的社会纽带模式都能在更小规模的团队结构中找到对应。正如在我们关于公司的研究(第4章和第5章)中所看到的那样,亲密的社会纽带对参与有支持作用,因为这些人更有可能互相交谈,从而进一步把想法转变为行动。远距离的社会纽带则起着探索的作用,因为我们在新环境中遇见“新人”,并从他们那里收获新想法。
然而在公司里,在工作团队和“其他人”之间通常有着明确的边界。工作之外,在我们与其他人互动的整个模式中,探索和参与之间通常并没有明确的边界。也就是说,当我们考察所有的互动时,可以看到人们具有多个社会角色(例如母亲、同事、公民、爵士乐爱好者等),并且每个角色涉及不同的人群,因此,在个人社会网络中,参与和探索的功能是结合在一起的。
探索越多,城市越富足
前面的章节介绍了我的研究小组利用从手机、社会网络和社会计量标牌等大数据源采集的数据所做的研究。观察人类行为的另一个大数据透镜是信用卡数据。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01