京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据与人工相结合,谷歌地图够精准吗_数据分析师
12月9日消息,据国外媒体报道,我们使用的导航地图近十年已经发生了翻天覆地的变化。上世纪90年代,我们还在用纸质地图寻找目的地。而现在基本只需要服从Siri或她的谷歌竞争对手的导航指令。
“地面真相”算法和街景服务
不过这些导航指令背后隐藏着大多数人无法想象的众多数据。目前由于谷歌已经获得了极其庞大的地图数据,他们开始采用大数据方法,或谷歌称之为“地面真相”的算法和细致的人工努力相结合的方法,为用户提供更详尽的地图信息。该项目于2008年推出,但它一直处于保密状态,直到几年前才公开。它持续增长,现已覆盖51个国家。这一算法在提取卫星、空中和街景视图的信息时发挥了巨大的作用。
谷歌“地面真相”算法可以识别的街景信息
谷歌2007年推出了街景服务,通过让人们看到目的地周围的环境来提高用户体验。谷歌地图副总裁布莱恩·麦克伦登(Brian McClendon)。表示,“我们很快就意识到做地图的最佳途径之一,就是拥有全世界的街头照片。”
随着街景收集数据的增长,抽查他们的数据已经不是很好的解决方案。谷歌地图产品经理马尼克·古普塔(Manik Gupta)表示,现在街景车已经行驶700多万英里,覆盖美国99%的公共道路,“它实际上使我们能够利用算法建立提取信息之外的新数据层。”
这些算法借用计算机视觉和机器学习的方法来提取路边的街道编号、企业名称、限速交通标志等细节信息。 不过很多信息还是非常难以提取,麦克伦登表示,“停止标记常常很容易被忽略。转弯限制对于导航来说也很重要,但对于谷歌的捕捉算法还很难处理。因为这些标记箭头可能是被画在道路上,它们可以是不同的颜色和大小。车道标记的分析更难,因为他们并不一致。”
谷歌地图普通用户不可见的转弯限制信息。
路牌也是非常重要的信息。驾驶者听到的导航指示如果能匹配他们看到的,那么他们就能更好的被指引。但有时街道标志使用的拼写或缩写导致了很多麻烦。“匹配标志上的文字实际上是一个很困难的任务。”
另外,谷歌的算法还可以利用卫星和航空影像提取建筑物的轮廓和高度。美国大多数的建筑物现在都可以在谷歌地图上找到。对于像西雅图太空针塔这样的标志性建筑,计算机视觉技术已经可以提取出详细的3D模型。谷歌曾表示,它收购高分辨率卫星图像公司Skybox就是为了提高其地图的准确性。
计算机视觉技术提取的标志性建筑物3D模型
职业地图纠错团队和MapMaker计划
然而,卫星和算法的能力还是有限。为了提供最好的体验,谷歌雇佣了一只由人类组成的团队,手动检查并使用内部程序Atlas纠正地图的错误。谷歌公司以外很少有人见过这一应用。
这一人工检查团队看到的地图类似于谷歌地图的卫星地图混合视图,但带有没见过的彩色线条和符号。例如,道路根据行进方向进行了颜色编码。绿色和红色箭头指示了给定的交叉路口的可能前进方向。工作人员可以点击屏幕一侧的按钮,拖曳、切换或关闭各种层,控制街景视图拍摄的交通标志的出现和消失。这些工作人员每天要检查数以千计来自谷歌地图用户的错误报告,并根据需要进行修复。
工作人员可以手动将地图道路(左上)对准卫星图像
古普塔还展示了一张显示道路优先级的地图,线的宽度代表交通流量。谷歌一直用手机的位置信号映射交通条件。不过古普塔承认,位置信号也可以是其他信息的良好来源,比如转弯限制或者单行线。但他拒绝详细说明,“谷歌在很多地方使用了位置信息,但我不能谈论具体的东西。”
除了职业地图纠错团队,谷歌还得到来自MapMaker计划的帮助。2011年谷歌推出了普通用户可以参与的地图纠错项目,现在的该项目遍及220个国家。目标是提高谷歌地图在发展中国家和其他地区的准确度。因为在那里无法获得详细的地图源,“我们招募用户添加对于他们很重要的地图信息。我们会提供工具和卫星图像,因此他们可以很轻松的进行修正。”
用户可以提供公园、步道以及其他街景车无法进入的地方的信息。麦克伦登本人就曾帮助绘制Windy山的登山路径,“我用GPS记录了我登山的路径,完善了更多的精确路线。”
当你在笔记本电脑或手机上使用谷歌地图时,表面的信息之下隐藏着更多的数据。不只是道路的布局,还包括链接一个点到另一个点的逻辑信息。信息不只是建筑物的形状,也许未来谷歌地图只会不断的细节化。最终,呈现出来的可能是让人震惊的世界3D虚拟图像。
道路标志可利用算法从街景中提取,从而提供交通信息
(秉翰)
相关阅读:
新版谷歌地图将深度集成Uber和OpenTable
5月谷歌地图集成了一些Uber应用功能,如“叫Uber车”和查看估计的坐车时间。现在,谷歌地图将能显示估计的上车时间和路线价格。如果你准备去餐馆,使用新的谷歌地图可通过OpenTable预定(只限美国)。
Google Maps变得更加色彩化,推出iOS和Andriod版
继Google推出全新设计的日历app之后,又推出全新设计的Google地图,Google地图的设计更加色彩画,时尚的风格更具有视觉效果视觉效果。Google Maps展示了iPhone、Android手机与平板电脑上的版本,但没有提到iPad上是否能使用。
相关话题:
公交导航,能否占据地图数据产业下一个"竿位"
公交导航发布,标志着互联网地图应用已经从普及进入实时导航阶段。地图数据后续的发展方向之一,能为公共交通出行提供全程流畅的提醒和导航的,就是公交导航了。
地图应用推O2O商业化,时机并不成熟
之所以会有“地图产品上该不该力推商业化O2O”的疑问,从产品角度看,可以转化为“用户对于地图产品的期望是不是生活服务消费”?从几个维度的数据来看,这种设想中的行为模式还没成气候。
那些年,曾经被我们误读的大数据
业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然而,大数据挖掘、大数据分析、大数据营销等等事情仅仅只是个开始当然,也有很多人直接批判大数据或大数据营销给我们造成的隐私威胁,大数据到底是什么?它又有着哪些价值呢?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23