京公网安备 11010802034615号
经营许可证编号:京B2-20210330
城市科学大数据与社会物理学如何变革城市的发展_数据分析师培训
共享体验模式与社会纽带模式服从相同的一般规则。对社会网络中的每个人而言都是全新体验的最大的可能性,发生在人们最不常去的地方。去远处探索新想法是最有成效的,日常生活的普通体验则通过在本地社区的参与被升华为社会规范。
托马斯·杰斐逊(Thomas Jefferson)对18世纪的城市有一个著名的描述:“人性堕落的大阴沟。”但是,自杰斐逊时代以来,世界上的城市已经成百倍地增长,而且这种增长并无减弱的趋势。现在,居住在城市中的人口比例是有史以来最高的。既然城市有高昂的生活费用和比生活费用更高的犯罪率、污染程度以及传染病威胁,人们为什么还会持续不断地迁往城市?也许正如亚当·斯密所言:“城市中心既特别堕落又特别创新。”
尽管有关城市的研究已经持续了一个多世纪,我们对于为什么城市能促进创新依然缺乏一个有说服力的模型。城市确实有创新:相比于农村地区,城市更为有效地使用资源,产生更多的专利和发明,人均使用道路和服务更少。是否可以让更多人居住在一起以获得更有效的想法创新和更高的生产率?一些学者指出了技术扩散在创造智力资本中的作用,另一些人则阐述了层次化社会结构和专业化的作用。
专注于想法流而不是商品流
正如前面章节讨论的那样,社会网络互动和想法流是团队和企业里创意产出和生产率的主要推动力。这些社会物理学的概念在社会科学中几乎是仅有的可扩展的概念,并且正如本章要介绍的那样,这些概念完全可以超越小的团队和企业,扩展到城市层面,并通过这些大得多的社会网络促成更高的生产率和更大的创造力。城市和公司一样都是想法机器。
我和潘巍、格拉·戈沙尔 (Gourab Ghoshal)、科科·克鲁姆(CocoKrumme)以及曼纽尔·塞布里安(ManuelCebrian)等学生和同事一起建立了一个数学模型,它基于在面对面距离内的人数来阐述社会纽带如何推动城市里的想法流。正如我们在《自然通讯》(NatureCommunications)的一篇文章中描述的那样,这是一个定量预测GDP和创意产出的简单、自下而上、鲁棒的模型。我们也已经能够说明,沿着社会纽带的想法流可以准确再现城市特征,包括艾滋病毒感染率、电话通信模式、犯罪率和专利权率,等等。它也为我们提供了设计更具创意和效率的城市,尽可能减少犯罪和其他负面因素的研究成果。
值得注意的是,这种从社会物理学的角度看待城市的方法是与传统的阶层和专业化模型不同的。前者专注的是想法流,而不是后者描述的社会的静态分割。这样看来,社会物理学类似于用工厂之间的距离和运输物品的成本等来解释城市制造业有效性的模型。而它们的不同之处在于:社会物理学把城市和公司定位为想法工厂,因此专注于想法的流动而不是物品的流动。
从这个观点看,社会物理学与社会学、地理学和探讨人口密度与创新之间关系的经济学,以及沿着社会纽带进行的传播和创造力研究是一脉相承的。社会物理学新的重要贡献在于把这些想法集成到单一数学模型中,并可用稠密、连续的行为数据以及能够获得的经济和社会结果数据来进行检验。社会纽带和想法流在人类互动模式、移动模式和城市经济特征之间提供了简单的生成链接,无需借助层次化、专业化或类似的社会结构概念。正如本章后续部分要阐述的那样,真
正重要的是想法的流动,而不是阶层或市场。
城市中的社会纽带模式
城市中社会纽带的模式可以通过如下概念描述:两个人之间产生关系的可能性是由“中介机会”(intervening opportunities)的数量决定的。其核心思想很简单:如果你在某群人中有许多“可能认识的人”,那么你与其中某个陌生人建立友谊的可能性就比较小。大卫·利本诺尔(David LibeNowell)及其同事研究了一个日记网站的成员并绘制了他们与朋友和熟人居住距离的信息。他们发现,对于大多数朋友而言,两个人形成社会纽带的可能性与在这两人之间的地点上逗留的人数成反比。
在一个基于位置的社会网络应用Gowalla中发现了类似的关系,Gowalla记录个人及其朋友“签到”的地点。研究人员使用这些数据可以知道朋友之间居住距离的远近,以及朋友们去同一个地点的频率。这一研究得到了一个简单的数学方程,它描述了人们往往会和住在附近的人有较多的社会纽带,并且随着距离的增加,纽带的数量也越来越少。
然而,这一关于社会纽带的数学关系还有其他更为有趣的应用。例如,艾滋病这类疾病的传播显然依赖社会纽带的分布,打电话模式也是如此(当然依赖方式非常不同)。打电话模式作为区县人口的函数和艾滋病的感染率作为每平方英里人口密度的函数,这是两种非常不同的现象。然而,两者都可以用通过分析网站与社会网络所测量的距离与社会纽带数量之间相同的数学关系来预测。
城市中所有的社会纽带模式都能在更小规模的团队结构中找到对应。正如在我们关于公司的研究(第4章和第5章)中所看到的那样,亲密的社会纽带对参与有支持作用,因为这些人更有可能互相交谈,从而进一步把想法转变为行动。远距离的社会纽带则起着探索的作用,因为我们在新环境中遇见“新人”,并从他们那里收获新想法。
然而在公司里,在工作团队和“其他人”之间通常有着明确的边界。工作之外,在我们与其他人互动的整个模式中,探索和参与之间通常并没有明确的边界。也就是说,当我们考察所有的互动时,可以看到人们具有多个社会角色(例如母亲、同事、公民、爵士乐爱好者等),并且每个角色涉及不同的人群,因此,在个人社会网络中,参与和探索的功能是结合在一起的。
探索越多,城市越富足
前面的章节介绍了我的研究小组利用从手机、社会网络和社会计量标牌等大数据源采集的数据所做的研究。观察人类行为的另一个大数据透镜是信用卡数据。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21