京公网安备 11010802034615号
经营许可证编号:京B2-20210330
谁在读你的微博 大数据分析将给出答案
现在,你的推文(Tweets)正在被哪些人阅读?他们往往是你所购产品的制造商。最近一项融合了许多学科知识的有趣实验正在用于分析淹没在推特(Twitter)宇宙大数据中的各种观点。Esri、IBM等致力于大数据研究的各个厂家目前都在挖掘Twitter内容,并且运用自己开发的方法对其进行分析。近年来,这种合作开启了一个研究的新时代,Esri公司的地理信息系统(GIS)技术联合IBM的语言与心理分析,可以共同解码互联网上那些浩如烟海的信息。
社交媒体地图
众所周知,我们处在信息爆炸的时代,大多数IT大佬都承认,如果不能尽快地控制数据的泛滥成灾,将会对人类进步形成巨大的威胁。驯服大数据需要发明新的技术,通过分析和可视化来更好地了解这个庞然大物。
多年来,社交媒体为Esri地图提供了丰富的数据源。2011年,Esri推出了日本地震图,这是一份概念验证(proof-of-concept)地图,来自日本数百万Tweets信息为地图的绘制提供了数据源,9.0级的本州地震后来自Tweets的数据帮助揭示了在危机中的那些急需物资救援的地点。从此,用社交媒体的内容充实各种地图就成了司空见惯的做法。2013年,Esri正式进入大数据领域,将大数据工作流程整合进该公司的ArcGIS产品中,并推出包括GIS Tools for Hadoop在内的数个GitHub开源项目,这些项目使大数据获得了地理空间能力。
品牌监测
社交媒体的高容量、多样化、高速度及真实性满足大数据的4大典型特征。每天都有超过5亿的Tweets信息发布以及超过35亿类似的自媒体信息发布,社交媒体是一个具有超大信息量并且充满噪声的数据源范例。在这些喋喋不休中,Twitter用户可分享其酸甜苦辣的各种经历和各种观点。但是过滤掉噪声,依然可以从那些充满观点的Tweets中窥见买家的心态和想法。
通过与IBM阿尔马登研究中心的加速发现实验室合作,Esri创建了一种称为舆情监控的交互式概念验证(proof-of-concept)地图,使用Tweets和地理空间技术来了解客户情感并聚焦于品牌管理。IBM阿尔马登研究中心的加速发现实验室是进行跨行业大数据分析的最先进的实验室。
Esri总裁Jack Dangermond说,“和GIS的出现一样,大数据分析的出现也是因为需要对出现的问题提供正确的答案。通过分析,我们提取了某些的答案并帮助各机构能更好地了解其客户。Esri/IBM联合舆情监控示范则结合了GIS系统和舆情监控领域的最新研究成果。”
Esri Tapestry数据为品牌管理提供有用的客户生活方式信息
解码Decahose
Tweets内容包含了大量的客户观点信息,因此早在2010年,Twitter就将其每日的用户输出内容进行商品化。Twitter建立了Tweets流许可制,各个企业以及咨询公司都可从这些数据中淘金。为了着手进行社交媒体分析,IBM从第三方经销商手中获得了Twitter DecaHose授权(特定时间段内随机抽取特定范围内百分之十的Tweets信息)。
针对这些信息,服装零售商所关心的是品牌管理工具是否可以监控Tweets中所有的客户观点。IBM加速发现实验室的研究员们准备利用品牌管理工具,从多个角度来回答这个有趣的问题。2013年3月,8家全国性服装品牌被选作样本,IBM与Esri合作进行联合舆情监控示范项目。
为了设计舆情监控示范系统,Esri的开发人员花了一天的时间与IBM的研究员们进行讨论,实验室中所有的软件、数据和专利技术都对其开放。最后,利用Portal for ArcGIS和ArcGIS for Server,Esri开发了一套交互式地图应用,通过位置和时间可视化Twitter用户数据。这有助于实验室定义Tweets内容模式,对人口统计资料和客户类型进行更直观的认识。IBM的社交媒体分析方法可以解码客户观点、位置及心理语言等各种属性,可以按地区对服装品牌形象进行评价。通过IBM加速发现实验室的算法,可推测出未包括在Tweets中的Tweets发送者的概要信息,如性别及个性特点等,并显示在地图底部。从下拉菜单中选择参与服装品牌,在不同零售商之间轻松比较Tweets提及率和及其客户特点。从更微观的角度,实验室的心理分析与来自Esri Tapestry人口统计数据分析可以并发执行分析得出结果,这个结果可以整合买主本质特征,在个体层面进行数据梳理,为品牌经理提供了一个客户关系管理的超强工具。
监控危机范围
Esri及IBM舆情监控示范实验分别按照品牌的正面提及和负面提及做了划分,并在地图上显示出来
对参加舆情监控实验的一家服装零售商而言,2013年的某一周就像是永远。2013年,该公司因某签名品牌的服装的一个瑕疵而遭到了连珠炮式的投诉。
可以预见的是,在美国某些地区,通过Tweets活动进行品牌监测的现象会增加,这些地区的位置将在舆情监控地图上表示出来。通过地理位置显示Tweets信息,可以了解不同地域的人们对产品瑕疵的反映,对社交媒体进行分析可以为在出现危机时第一时间实施品牌管理提供有利的实时信息。
“GIS可帮助确定问题的范围。”IBM加速发现实验室研究人员兼数据整合专家Mary Roth说,“结合我们的分析,Esri可快速确定这股Tweets风暴来自何方,比如说,如果只是来自罗德岛,地理处理数据会显示出该问题只是地方性问题而没有蔓延至全国。重要的是,这样的信息最终会降低响应成本。”
舆情监控示范是从Twitter信息源中提取和展示分析结果的最简单有效的方法。一旦Tweets信息的价值被发现,品牌经理就可通过研究Tweets发送者的个性特点和人口统计资料进行深入的数据挖掘,但是显示在地图中的数据不会泄露任何用户的隐私。这种方法为各公司彻底了解其客户提供了依据,并借此量身定制其品牌形象,更快、更有针对性地对品牌危机做出反应。
针对所有人的大数据分析
尽管有点吓人,但数据洪流仍为以前不可能进行的研究创造了新的机遇,而不再是陈旧零碎的分析。舆情监控仅是大数据研究的冰山一角,Esri和IBM目前正在设计新的大数据分析方法,该方法将地理分析与其合作研发的方法体系结合在一起。今年,Esri将在进一步加强在此领域的研究,并将发布一系列革命性的针对大数据研究的新工具和方法。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22