京公网安备 11010802034615号
经营许可证编号:京B2-20210330
谁在读你的微博 大数据分析将给出答案
现在,你的推文(Tweets)正在被哪些人阅读?他们往往是你所购产品的制造商。最近一项融合了许多学科知识的有趣实验正在用于分析淹没在推特(Twitter)宇宙大数据中的各种观点。Esri、IBM等致力于大数据研究的各个厂家目前都在挖掘Twitter内容,并且运用自己开发的方法对其进行分析。近年来,这种合作开启了一个研究的新时代,Esri公司的地理信息系统(GIS)技术联合IBM的语言与心理分析,可以共同解码互联网上那些浩如烟海的信息。
社交媒体地图
众所周知,我们处在信息爆炸的时代,大多数IT大佬都承认,如果不能尽快地控制数据的泛滥成灾,将会对人类进步形成巨大的威胁。驯服大数据需要发明新的技术,通过分析和可视化来更好地了解这个庞然大物。
多年来,社交媒体为Esri地图提供了丰富的数据源。2011年,Esri推出了日本地震图,这是一份概念验证(proof-of-concept)地图,来自日本数百万Tweets信息为地图的绘制提供了数据源,9.0级的本州地震后来自Tweets的数据帮助揭示了在危机中的那些急需物资救援的地点。从此,用社交媒体的内容充实各种地图就成了司空见惯的做法。2013年,Esri正式进入大数据领域,将大数据工作流程整合进该公司的ArcGIS产品中,并推出包括GIS Tools for Hadoop在内的数个GitHub开源项目,这些项目使大数据获得了地理空间能力。
品牌监测
社交媒体的高容量、多样化、高速度及真实性满足大数据的4大典型特征。每天都有超过5亿的Tweets信息发布以及超过35亿类似的自媒体信息发布,社交媒体是一个具有超大信息量并且充满噪声的数据源范例。在这些喋喋不休中,Twitter用户可分享其酸甜苦辣的各种经历和各种观点。但是过滤掉噪声,依然可以从那些充满观点的Tweets中窥见买家的心态和想法。
通过与IBM阿尔马登研究中心的加速发现实验室合作,Esri创建了一种称为舆情监控的交互式概念验证(proof-of-concept)地图,使用Tweets和地理空间技术来了解客户情感并聚焦于品牌管理。IBM阿尔马登研究中心的加速发现实验室是进行跨行业大数据分析的最先进的实验室。
Esri总裁Jack Dangermond说,“和GIS的出现一样,大数据分析的出现也是因为需要对出现的问题提供正确的答案。通过分析,我们提取了某些的答案并帮助各机构能更好地了解其客户。Esri/IBM联合舆情监控示范则结合了GIS系统和舆情监控领域的最新研究成果。”
Esri Tapestry数据为品牌管理提供有用的客户生活方式信息
解码Decahose
Tweets内容包含了大量的客户观点信息,因此早在2010年,Twitter就将其每日的用户输出内容进行商品化。Twitter建立了Tweets流许可制,各个企业以及咨询公司都可从这些数据中淘金。为了着手进行社交媒体分析,IBM从第三方经销商手中获得了Twitter DecaHose授权(特定时间段内随机抽取特定范围内百分之十的Tweets信息)。
针对这些信息,服装零售商所关心的是品牌管理工具是否可以监控Tweets中所有的客户观点。IBM加速发现实验室的研究员们准备利用品牌管理工具,从多个角度来回答这个有趣的问题。2013年3月,8家全国性服装品牌被选作样本,IBM与Esri合作进行联合舆情监控示范项目。
为了设计舆情监控示范系统,Esri的开发人员花了一天的时间与IBM的研究员们进行讨论,实验室中所有的软件、数据和专利技术都对其开放。最后,利用Portal for ArcGIS和ArcGIS for Server,Esri开发了一套交互式地图应用,通过位置和时间可视化Twitter用户数据。这有助于实验室定义Tweets内容模式,对人口统计资料和客户类型进行更直观的认识。IBM的社交媒体分析方法可以解码客户观点、位置及心理语言等各种属性,可以按地区对服装品牌形象进行评价。通过IBM加速发现实验室的算法,可推测出未包括在Tweets中的Tweets发送者的概要信息,如性别及个性特点等,并显示在地图底部。从下拉菜单中选择参与服装品牌,在不同零售商之间轻松比较Tweets提及率和及其客户特点。从更微观的角度,实验室的心理分析与来自Esri Tapestry人口统计数据分析可以并发执行分析得出结果,这个结果可以整合买主本质特征,在个体层面进行数据梳理,为品牌经理提供了一个客户关系管理的超强工具。
监控危机范围
Esri及IBM舆情监控示范实验分别按照品牌的正面提及和负面提及做了划分,并在地图上显示出来
对参加舆情监控实验的一家服装零售商而言,2013年的某一周就像是永远。2013年,该公司因某签名品牌的服装的一个瑕疵而遭到了连珠炮式的投诉。
可以预见的是,在美国某些地区,通过Tweets活动进行品牌监测的现象会增加,这些地区的位置将在舆情监控地图上表示出来。通过地理位置显示Tweets信息,可以了解不同地域的人们对产品瑕疵的反映,对社交媒体进行分析可以为在出现危机时第一时间实施品牌管理提供有利的实时信息。
“GIS可帮助确定问题的范围。”IBM加速发现实验室研究人员兼数据整合专家Mary Roth说,“结合我们的分析,Esri可快速确定这股Tweets风暴来自何方,比如说,如果只是来自罗德岛,地理处理数据会显示出该问题只是地方性问题而没有蔓延至全国。重要的是,这样的信息最终会降低响应成本。”
舆情监控示范是从Twitter信息源中提取和展示分析结果的最简单有效的方法。一旦Tweets信息的价值被发现,品牌经理就可通过研究Tweets发送者的个性特点和人口统计资料进行深入的数据挖掘,但是显示在地图中的数据不会泄露任何用户的隐私。这种方法为各公司彻底了解其客户提供了依据,并借此量身定制其品牌形象,更快、更有针对性地对品牌危机做出反应。
针对所有人的大数据分析
尽管有点吓人,但数据洪流仍为以前不可能进行的研究创造了新的机遇,而不再是陈旧零碎的分析。舆情监控仅是大数据研究的冰山一角,Esri和IBM目前正在设计新的大数据分析方法,该方法将地理分析与其合作研发的方法体系结合在一起。今年,Esri将在进一步加强在此领域的研究,并将发布一系列革命性的针对大数据研究的新工具和方法。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01