京公网安备 11010802034615号
经营许可证编号:京B2-20210330
纽约,大数据挖掘预防火灾
作为一个国际化的大都市,纽约大约有100万栋建筑物,平均每年约有3000栋会发生严重的火灾。那是否有方法预防悲剧的发生呢?据华盛顿邮报报道,纽约消防部门的数据分析师认为,每栋建筑物都有着独特的属性,通过对大量数据的分析就能看出哪些建筑物更易“惹火上身”。
纽约市长手下有一支大数据分析团队,他们的主要职责就是搜集各类城市数据信息,进行趋势分析预测,解决城市治理顽疾。在前市长Michael Bloomberg的推动下,纽约已逐渐发展为数据型城市。过去几年间,不同职能部门通过数据挖掘(data mining)和数据分析解决了包括下水道油污堵塞、罪犯追踪在内的多种城市治理问题。要准确掌握纽约这类超大城市的脉络和动向,数据挖掘是其中重要的一环。
判断一栋建筑物是否属“火”有几条重要的标准:例如贫穷、低收入家庭的住房往往更容易发生火灾,而且低收入人群由于居住密度较高,一旦发生火灾危害更大。建筑物的建成时间也是一个应该着重考量的因素,相对而言,年代久远的房子问题更多,它们很容易由于电路老化或布局不合理引发火灾,而且老房子消防设施落后,发生火灾后,消防员赶赴现场,往往会发现附近根本就没有足够的消防栓。另外,建筑物,尤其是高层建筑中,电梯也是一个重要的影响因素,在很多电梯间明确标注着火灾时严禁使用,这是由于“烟囱效应”使得火势在建筑竖井中蔓延更快,而一旦断电电梯停运,人员的处境就更加危险了。但也有一些电梯配备了备用电源,一般是柴油发电机,并有足够的防火隔离措施,方便住户快速逃生。诸如此类因素,不一而足。
纽约消防部门将可能导致房屋起火的因素细分为 60 个。除去危害性较小的小型独栋别墅或联排别墅,分析人员通过特定算法,对城市中 33 万栋需要检验的建筑物单独进行打分,计算火灾危险指数。这样一来,消防员在出勤时可以根据建筑物的详细资料和危险指数,重点关照“火灾危险分子”。
这项庞大的数据挖掘系统在去年7月份开始实施,并在下半年将数据监测项目扩大到2400余项,诸如学校、图书馆等人口密集度高的场所都会被列入重点监测和检查对象。不过目前公众的质疑在于,如何证明数据分析和防范措施的有效性?纽约消防局发言人表示:“答案还是数据本身,因为我们最终会统计出火灾数量是在下降的。”
芝加哥,给路灯杆装上传感器
可穿戴设备的兴起,使传感器堂而皇之地爬上了人的身体;接着,我们的卧室厨房也被Nest等温控和烟雾传感器占领;我们随身携带的手机,集成的传感器将近10种之多:光线感应器、距离传感器、指纹扫描、GPS、陀螺仪、心率传感器、加速感应器、气压传感器、手势传感器等等;而最近,美国芝加哥市更把传感器安装到了街边路灯杆上,用于收集城市不同角落的路面信息和环境数据。
众多传感器被包括在设计精美、布满小孔的金属盒子里,然后安装在灯柱上,装点城市的同时也能监测空气质量、光照强度、噪音水平、温度、风速,还会通过监测手机Wi-Fi或蓝牙信号清点过往的行人。第一批“灯柱传感器”将在今年7 月中旬安置在芝加哥市密歇根大道上8个繁忙的十字路口。后续会首先在旧城区布置,预计 2015 年底完成,并在未来几年全面占领芝加哥市的大小街区。
面对公众对于侵犯个人隐私的质疑,参与这个计划的科学家,芝加哥城市计算和数据中心负责人Charlie Catlett称,设备在设计之初便做好了规划,只侦测信号,不会记录移动设备的MAC和蓝牙地址,“我们的目的是为了更好地理解城市,这也会让芝加哥市成为最有科研价值的城市。”
在近10年间,全球各大城市都致力于收集城市的各类信息数据,从空气质量、温湿度,到道路车流量和人流量,这种种举措都是为了让城市运作得更加安全高效,而芝加哥市则做得更为彻底——其正在全力打造“大数据之城”。虽然收集和分析大量城市的信息数据,并不会对城市的交通、环境或是安全形势起到立竿见影的效果,但研究人员相信,这些数据将有助于更好地研究和理解现代都市的运作原理,然后逐步从数据中挖掘有价值的信息;而且随着数据量的不断增大,科学家们可以发现和构建不同的模型,并将反过来指导城市规划和政策制定等等。比如芝加哥市安装的此类永久性的数据采集装置将会为政府、独立研究机构或是大学提供概念验证和方案测试服务,并会随着传感器技术的进步及时进行产品升级,满足潜在的科研和学术需求。
另据芝加哥城市信息技术委员会成员Berman介绍,每台传感器设备初次采购和安装调试成本在215425美元之间,运行后的年平均用电成本约为15美元。该研究项目得到了包括思科、英特尔、高通、斑马技术公司(Zebra Technologies)、摩托罗拉以及施耐德等的技术和资金支持。
过去10年,我国一直在不遗余力地鼓励、扶持国内智慧城市的发展,中央和各地方政府投入了大量的资金进行相关的基础设施建设,以平安城市中的科技强警战略和“3111”试点工程两大项目为例,从2004年国家提出创建平安城市、平安社会到2010年止的6年多时间内,科技强警示范城市总量达180多个,“3111”示范城市覆盖80多个地市以及下属的400多个市、县和街区,总投资额达千亿元以上,先后投入使用的各种终端设备和传感器数量巨大、收集到的各种信息和数据更难以统计。如何才能更有效地用好这些基础设施?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27