京公网安备 11010802034615号
经营许可证编号:京B2-20210330
交通大数据开放试水 为城市规划、基建提供参考
如果说大数据应用给衣食住行带来哪些影响,体会最深的应该是交通出行的变革上。从打车软件、智能公交到航班预测,无处不在的交通大数据,正在改变我们的出行方式。
智能交通相关的互联网公司,只用两到三年的时间,在为用户提供高效服务的同时,也迅速积累了大批的运营数据,其数据资产开发被普遍看好。同时,许多地方政府把交通大数据的开放,作为最先开放试点的领域,上海已经宣布开放十大方面上千GB容量的交通数据。
以滴滴快的公司和上海、珠海地方政府签约,共建“出租汽车信息服务平台”为代表的政企合作为例,不管是亢奋激昂的企业界,还是谨慎敏感的地方政府,交通大数据的应用,正在进入良性生态循环。
阿里研究院数据经济研究中心秘书长潘永花表示,在“互联网+”的过程中产生了一个个奇迹,不管是像Uber,包括京东、淘宝等等,这些行业奇迹总结起来都是数据驱动,数据在整个“互联网”过程中起着非常核心的作用。
交通数据解决城市问题
2015年8月的一天,邹明需要从天通苑到中关村(8.81, 0.00, 0.00%)上班。
他的出行,除了传统的地铁、公交,还可以使用滴滴快的、Uber等系列软件,选择范围包括专车、租车、顺风车,还有滴滴巴士;他如果开私家车,还可以成为一名顺风车司机;另外,即便他坐公交,也可使用智能公交软件,确定公交车到站时间。
上述场景,即交通大数据在市民出行中的应用。
目前滴滴快的、Uber等互联网公司,通过交通大数据协调城市交通车辆,让邹明的出行有了多元选择,邹明们也为滴滴、Uber这样的公司提供了海量的出行数据。
8月27日,在2015年国际大数据会议上,嘉宾分别分享了大数据在会展、机器人(51.800,0.00, 0.00%)、互联网金融等各个领域的应用,其中关于大数据在交通中的应用,吸引了最多参会者的注意力。
Uber中国大数据专家江天介绍,目前Uber在全球330个城市掌握大量运营数据,通过数据分析,可以把握城市人群出行的特点。江天透露,Uber在上海65%的行程,是在地铁站周围开始或结束。他表示,数据显示,Uber所提供的服务,是公共交通的补充,是公众出行最后一公里的选择。
另一家在中国市场占有大份额的打车软件公司——滴滴快的公司,其滴滴机器学习研究院高级研究员胡尧告诉21世纪经济报道记者,关于交通大数据的应用,早年在学术界和业界很少有关注,直到近三年才开始被重视和应用,成为移动互联网新业态的产物。
目前他们掌握的交通大数据,主要以用户的打车记录、司机的行车轨迹等为主,还包括与政府共享的部分数据。公司创建三年来以来,已有过亿用户的无数次打车记录,从2014年到现在,他们掌握的数据增加了100倍以上。
胡尧表示,前期数据量小的时候,分析难度较大。目前数据每天都在快速增长,滴滴快的通过海量的数据分析,对运力的把握和调度会越来越科学,更能精确地匹配好乘客和司机,同时也会吸引更多的用户;目前从获取数据到数据的分析和应用,公司已经进入了良性的循环阶段。
按照江天的表述,他们获取的交通大数据,除了提高自身产品和服务,还可以为政府规划、基础设施建设等提供参考。江天以Uber与波士顿的合作举例,公司利用Uber平台上的大数据,帮助波士顿解决更多城市问题,包括打造智慧城市,减少交通拥堵,发展公共交通等。
Uber中国相关负责人告诉21世纪经济报道记者,Uber承诺在确保乘客和司机隐私的前提下,适当利用大数据,力求在大小社区都能够将大数据和政策联系起来。目前他们将提供按照美国人口普查局邮编地理界线“邮编制表地区”(ZCTA) 格式组织的匿名化行程级数据。滴滴快的方面人士也在谈及与政府部门的合作时也表示,他们不会共享所有的数据,因为有些数据涉及用户隐私。
业界人士认为,目前在大数据挖掘方面,交通大数据的开发和应用,已经有了明显起色。
重复使用的“交通数据金矿”
事实上,很多交通大数据,已在产生商业价值。
滴滴快的相关负责人此前接受采访时曾表示,“滴滴快的”与阿里巴巴[微博]、美团的合作正在完善用户“画像”,建立起精准营销的模式,未来在分析出消费偏好的基础上,就可以更有针对性地发送特定商场、特定店铺某一类产品的优惠信息。
对于Uber,有媒体预测,“我们将看到Uber变形成像Google、Facebook以及Visa一样的大数据公司:依靠它们掌握的有关用户的大量信息创造新的服务,并将这些数据出售给其他公司产生盈利”。
Uber中国相关人士告诉21世纪经济报道记者,Uber的定位并不是数据公司,而是靠数据驱动以交通为切入口,提高资源配置效率的高科技公司。
“我们商业模式的本质是以大数据为基础,通过对大数据的提炼、分析和应用,帮助和支持城市管理者提高社会效率,通过对闲置资源的利用让效率最大化。”上述人士还表示,Uber很多日常决策制定都以数据深度分析做基础,依靠数据支撑经营管理。其数据利用的范围,不仅仅是交通方面。
从这些企业的战略布局上来说,大数据提炼和应用业务,已经成为他们未来布局的重要领域。有业内人士总结,打车软件公司之间的竞争,已经从之前的比烧钱拼补贴,发展到现在的大数据PK。
滴滴快的公司在今年7月宣布完成了20亿美元的融资后,滴滴快的公司总裁柳青,在接受媒体采访回答这笔钱的使用安排时称,接下来不仅仅是补贴上的投入,还包括技术、产品、大数据以及市场方面的投入。
滴滴快的相关负责人告诉21世纪经济报道记者,今年五六月份,他们成立了大数据机器学习研究院,目前已经吸引了很多高端数据人才。该人士还透露,9月份,将至少有10位国外顶级研发机构、知名互联网公司的大数据专家,加盟大数据机器学习研究院。
目前,滴滴已经在用户画像系统、精准营销、智能匹配、需求预测系统和运能预测系统等方面做了大量研究。
胡尧还表示,在交通大数据挖掘、分析和应用等环节,最难的还是数据的分析,这是数据交通产业链的关键。“有人说数据就像是金矿,如果不懂提炼,金矿就只是一堆石头。”他表示,数据金矿可以反复利用,同一份数据可以从多个维度来作分析和应用,从中反复掘金。
交通数据开放试水
互联网公司对交通大数据的应用尝试,不断刷新公众对数据的认知。对于地方政府而言,交通大数据的开放也正在试水。
8月19日,国务院常务会议审议通过《关于促进大数据发展的行动纲要》。其中提到,在具体信息公开领域,优先推动交通、医疗、就业、社保等民生领域政府数据向社会开放。
对于地方政府来说,交通大数据的开放,也成为地方首先试水数据开放的板块。以上海市为例,8月18日,上海市宣布开放十大方面上千GB容量的交通数据,支持上海开放数据创新应用。其宣布开放的数据中,包括城市道路交通指数、地铁运行数据、一卡通乘客刷卡数据、浦东公交车实时数据、强生出租车行车数据、空气质量状况、气象数据、道路事故等。
上海官方消息称,希望吸引民间高手贡献智慧,开发出创新的互联网产品,为排解道路拥堵、优化公交规划等问题寻找对策。
除了上述举措,上海市还跟滴滴快的合作,共建“上海出租汽车信息服务平台”。据滴滴快的方面介绍,该平台是由上海市交通委、上海市四大出租汽车企业和“滴滴打车”合作打造,也是第三方打车软件第一次正式与官方合作。
据媒体报道,上海市交通委打算向滴滴快的放开部分市场,滴滴快的则会向上海出租汽车信息服务平台共享部分数据。
滴滴快的相关负责人告诉21世纪经济报道记者,他们一直在与全国各地地方政府商谈合作,试图跟政府共享交通部门的一些数据,同时向政府提供一些数据,为政府决策提供依据。上海的合作探路,也是为全国其他地方提供参考。
值得注意的是,这一年来,打车软件在跟地方政府接洽的同时,各种被约谈也屡见报端;在数据开放共享过程中,交通数据涉及到用户隐私,国家安全,地方政府也比较谨慎。
业内人士介绍称,上海之所以能成为第一个和打车软件签约合作的城市,跟上海创新改革的大环境有一定关系。
据滴滴快的方面人士介绍,今年8月份他们还跟珠海签了合作协议,双方将通过数据对接、资源共享等方式对驾驶员身份识别和评价等方面展开合作,与其他地方的合作还在积极对接中。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22