京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据红利窗口打开,看百度用大数据都做了什么
当下大数据产业风生水起,5月25日,中国大数据产业峰会暨中国电子商务创新发展峰会在贵阳召开。多位政府官员和业界人士在会上表示,随着技术的成熟和应用不断扩大,大数据产业正在进入成熟期,有望在“十三五”期间,引领市场规模万亿之巨的IT服务业转型。
包括大数据产业“十三五”规划在内的多个国家级产业促进政策,有望在下半年陆续出台。届时,大数据国家战略将加速落地,大数据产业将迎来新一轮发展机遇。
经过多年的深耕细作,百度在大数据应用领域可说是卓有成效。正如李彦宏在开幕式演讲中提到的,包括百度无人车在内的人工智能正是大数据的一个典型应用方向。
俗话说“一枝独放不是春”,如今大数据红利窗口打开,且看百度还将大数据技术应用在了哪些方面。
1 百度利用大数据技术“重现”加德满都
2015年4月尼泊尔发生8.1级地震,大量古建筑群遭遇灭顶之灾。4月30日,百度发起“See You Again,加德满都”活动,开辟专门的图片上传渠道收集全世界游客在尼泊尔拍摄的照片资料,并通过百度地图全景和照片游技术对遭到损坏的尼泊尔古迹进行数字化三维还原。
运用强大的大数据处理能力对海量图片进行筛选过滤,利用“路径搜索算法”找出古迹拍摄的热点(角度)区域,以串联热点区域游览为目标对采取何种路径游览该“复原古迹”进行智能规划。
2 百度迁徙,“据”说春节
2014年春节,央视晚间新闻采用百度地图LBS定位的可视化大数据,形成了“据”说春运系列特别报道。2015年,百度迁徙进行了技术“升级”,增加了基于百度天眼技术的“航班动态”及“延误航班和正点比例”,用更为系统立体的可视化大数据全景图配合2015年春节的“据”说过年特别报道。
百度迁徙从时间和空间两个维度全程、动态、即时、直观地展现中国春节前后人口大迁徙的轨迹与特征。人们可以在PC和手机上访问,选择不同城市和不同时点查看群体运动的轨迹。
3 百度大数据探测景区热力图
百度地图把热力图应用到日常出行领域,按照位置聚类,计算景区内聚类的人群密度和人流速度,综合计算出聚类地点的热度,从而将结果体现在“热力指数”中,反映出该景点的人气热度,以及在所在城市中的热度排名情况。
4 百度大数据解开“鬼城”之谜
2015年,《Ghost Cities of China》一书的作者Wade Shepard将“鬼城”定义为:一种能量严重不足的新型发展状态,一个人口和商业机构严重少于其原本所能容纳的体量的地方。从这个角度上说,住宅空置率就成为最简单直接的“鬼城”衡量标准。然而媒体报道时经常依据亮灯率所做的判断准确度并不高。
人们广泛应用的智能移动设备都具有位置感知功能,可产生大量个人轨迹数据,可覆盖极大的时空尺度,拥有超高的分辨率。通过这些时空大数据,百度从微观的角度来观察城市动力学(包括人类的迁移和区域之间的互动),使用每个个体所产生的数据来感知人们的生活环境。解开屡次见诸报道的中国“鬼城”之谜。
5 百度大数据分析上海外滩踩踏事件
2014年的12月31日上海外滩发生36死49伤的严重踩踏事故,事后调查显示事故原因主要是演出场地的临时变更导致人群一时间对该地的人流量、人群密度和移动方向做出了严重的估计错误。
针对类似情况,百度大数据实现了提前两小时预测局部区域内的人群密集程度,并发出预警。以提升公共安全服务为导向,百度大数据也在不断实践如何在公共安全领域应用时空大数据。
6 利用百度大数据选址
Big Data Lab(百度大数据实验室)通过分析时间、空间、网点、交通便利程度、竞争对手情况等等因素,结合用户需求,判断最佳的开店位置。用大数据测算结果跟实际地址对比一下。水滴标记是初算的地址,小圆点是第二、三步复算出的地址,大圆点是最终的建议选址。
正如李彦宏在“2016数博会”上所说的,人工智能为什么这么火?最主要的一个原因就是因为大数据。虚无缥缈的数据最终都会都汇总处理应用到生活服务的方方面面,大数据听起来很远,但其实就在我们身边。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22