京公网安备 11010802034615号
经营许可证编号:京B2-20210330
城市科学大数据与社会物理学如何变革城市的发展_数据分析师培训
共享体验模式与社会纽带模式服从相同的一般规则。对社会网络中的每个人而言都是全新体验的最大的可能性,发生在人们最不常去的地方。去远处探索新想法是最有成效的,日常生活的普通体验则通过在本地社区的参与被升华为社会规范。
托马斯·杰斐逊(Thomas Jefferson)对18世纪的城市有一个著名的描述:“人性堕落的大阴沟。”但是,自杰斐逊时代以来,世界上的城市已经成百倍地增长,而且这种增长并无减弱的趋势。现在,居住在城市中的人口比例是有史以来最高的。既然城市有高昂的生活费用和比生活费用更高的犯罪率、污染程度以及传染病威胁,人们为什么还会持续不断地迁往城市?也许正如亚当·斯密所言:“城市中心既特别堕落又特别创新。”
尽管有关城市的研究已经持续了一个多世纪,我们对于为什么城市能促进创新依然缺乏一个有说服力的模型。城市确实有创新:相比于农村地区,城市更为有效地使用资源,产生更多的专利和发明,人均使用道路和服务更少。是否可以让更多人居住在一起以获得更有效的想法创新和更高的生产率?一些学者指出了技术扩散在创造智力资本中的作用,另一些人则阐述了层次化社会结构和专业化的作用。
专注于想法流而不是商品流
正如前面章节讨论的那样,社会网络互动和想法流是团队和企业里创意产出和生产率的主要推动力。这些社会物理学的概念在社会科学中几乎是仅有的可扩展的概念,并且正如本章要介绍的那样,这些概念完全可以超越小的团队和企业,扩展到城市层面,并通过这些大得多的社会网络促成更高的生产率和更大的创造力。城市和公司一样都是想法机器。
我和潘巍、格拉·戈沙尔 (Gourab Ghoshal)、科科·克鲁姆(CocoKrumme)以及曼纽尔·塞布里安(ManuelCebrian)等学生和同事一起建立了一个数学模型,它基于在面对面距离内的人数来阐述社会纽带如何推动城市里的想法流。正如我们在《自然通讯》(NatureCommunications)的一篇文章中描述的那样,这是一个定量预测GDP和创意产出的简单、自下而上、鲁棒的模型。我们也已经能够说明,沿着社会纽带的想法流可以准确再现城市特征,包括艾滋病毒感染率、电话通信模式、犯罪率和专利权率,等等。它也为我们提供了设计更具创意和效率的城市,尽可能减少犯罪和其他负面因素的研究成果。
值得注意的是,这种从社会物理学的角度看待城市的方法是与传统的阶层和专业化模型不同的。前者专注的是想法流,而不是后者描述的社会的静态分割。这样看来,社会物理学类似于用工厂之间的距离和运输物品的成本等来解释城市制造业有效性的模型。而它们的不同之处在于:社会物理学把城市和公司定位为想法工厂,因此专注于想法的流动而不是物品的流动。
从这个观点看,社会物理学与社会学、地理学和探讨人口密度与创新之间关系的经济学,以及沿着社会纽带进行的传播和创造力研究是一脉相承的。社会物理学新的重要贡献在于把这些想法集成到单一数学模型中,并可用稠密、连续的行为数据以及能够获得的经济和社会结果数据来进行检验。社会纽带和想法流在人类互动模式、移动模式和城市经济特征之间提供了简单的生成链接,无需借助层次化、专业化或类似的社会结构概念。正如本章后续部分要阐述的那样,真
正重要的是想法的流动,而不是阶层或市场。
城市中的社会纽带模式
城市中社会纽带的模式可以通过如下概念描述:两个人之间产生关系的可能性是由“中介机会”(intervening opportunities)的数量决定的。其核心思想很简单:如果你在某群人中有许多“可能认识的人”,那么你与其中某个陌生人建立友谊的可能性就比较小。大卫·利本诺尔(David LibeNowell)及其同事研究了一个日记网站的成员并绘制了他们与朋友和熟人居住距离的信息。他们发现,对于大多数朋友而言,两个人形成社会纽带的可能性与在这两人之间的地点上逗留的人数成反比。
在一个基于位置的社会网络应用Gowalla中发现了类似的关系,Gowalla记录个人及其朋友“签到”的地点。研究人员使用这些数据可以知道朋友之间居住距离的远近,以及朋友们去同一个地点的频率。这一研究得到了一个简单的数学方程,它描述了人们往往会和住在附近的人有较多的社会纽带,并且随着距离的增加,纽带的数量也越来越少。
然而,这一关于社会纽带的数学关系还有其他更为有趣的应用。例如,艾滋病这类疾病的传播显然依赖社会纽带的分布,打电话模式也是如此(当然依赖方式非常不同)。打电话模式作为区县人口的函数和艾滋病的感染率作为每平方英里人口密度的函数,这是两种非常不同的现象。然而,两者都可以用通过分析网站与社会网络所测量的距离与社会纽带数量之间相同的数学关系来预测。
城市中所有的社会纽带模式都能在更小规模的团队结构中找到对应。正如在我们关于公司的研究(第4章和第5章)中所看到的那样,亲密的社会纽带对参与有支持作用,因为这些人更有可能互相交谈,从而进一步把想法转变为行动。远距离的社会纽带则起着探索的作用,因为我们在新环境中遇见“新人”,并从他们那里收获新想法。
然而在公司里,在工作团队和“其他人”之间通常有着明确的边界。工作之外,在我们与其他人互动的整个模式中,探索和参与之间通常并没有明确的边界。也就是说,当我们考察所有的互动时,可以看到人们具有多个社会角色(例如母亲、同事、公民、爵士乐爱好者等),并且每个角色涉及不同的人群,因此,在个人社会网络中,参与和探索的功能是结合在一起的。
探索越多,城市越富足
前面的章节介绍了我的研究小组利用从手机、社会网络和社会计量标牌等大数据源采集的数据所做的研究。观察人类行为的另一个大数据透镜是信用卡数据。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05