京公网安备 11010802034615号
经营许可证编号:京B2-20210330
谁在读你的微博 大数据分析将给出答案
现在,你的推文(Tweets)正在被哪些人阅读?他们往往是你所购产品的制造商。最近一项融合了许多学科知识的有趣实验正在用于分析淹没在推特(Twitter)宇宙大数据中的各种观点。Esri、IBM等致力于大数据研究的各个厂家目前都在挖掘Twitter内容,并且运用自己开发的方法对其进行分析。近年来,这种合作开启了一个研究的新时代,Esri公司的地理信息系统(GIS)技术联合IBM的语言与心理分析,可以共同解码互联网上那些浩如烟海的信息。
社交媒体地图
众所周知,我们处在信息爆炸的时代,大多数IT大佬都承认,如果不能尽快地控制数据的泛滥成灾,将会对人类进步形成巨大的威胁。驯服大数据需要发明新的技术,通过分析和可视化来更好地了解这个庞然大物。
多年来,社交媒体为Esri地图提供了丰富的数据源。2011年,Esri推出了日本地震图,这是一份概念验证(proof-of-concept)地图,来自日本数百万Tweets信息为地图的绘制提供了数据源,9.0级的本州地震后来自Tweets的数据帮助揭示了在危机中的那些急需物资救援的地点。从此,用社交媒体的内容充实各种地图就成了司空见惯的做法。2013年,Esri正式进入大数据领域,将大数据工作流程整合进该公司的ArcGIS产品中,并推出包括GIS Tools for Hadoop在内的数个GitHub开源项目,这些项目使大数据获得了地理空间能力。
品牌监测
社交媒体的高容量、多样化、高速度及真实性满足大数据的4大典型特征。每天都有超过5亿的Tweets信息发布以及超过35亿类似的自媒体信息发布,社交媒体是一个具有超大信息量并且充满噪声的数据源范例。在这些喋喋不休中,Twitter用户可分享其酸甜苦辣的各种经历和各种观点。但是过滤掉噪声,依然可以从那些充满观点的Tweets中窥见买家的心态和想法。
通过与IBM阿尔马登研究中心的加速发现实验室合作,Esri创建了一种称为舆情监控的交互式概念验证(proof-of-concept)地图,使用Tweets和地理空间技术来了解客户情感并聚焦于品牌管理。IBM阿尔马登研究中心的加速发现实验室是进行跨行业大数据分析的最先进的实验室。
Esri总裁Jack Dangermond说,“和GIS的出现一样,大数据分析的出现也是因为需要对出现的问题提供正确的答案。通过分析,我们提取了某些的答案并帮助各机构能更好地了解其客户。Esri/IBM联合舆情监控示范则结合了GIS系统和舆情监控领域的最新研究成果。”
Esri Tapestry数据为品牌管理提供有用的客户生活方式信息
解码Decahose
Tweets内容包含了大量的客户观点信息,因此早在2010年,Twitter就将其每日的用户输出内容进行商品化。Twitter建立了Tweets流许可制,各个企业以及咨询公司都可从这些数据中淘金。为了着手进行社交媒体分析,IBM从第三方经销商手中获得了Twitter DecaHose授权(特定时间段内随机抽取特定范围内百分之十的Tweets信息)。
针对这些信息,服装零售商所关心的是品牌管理工具是否可以监控Tweets中所有的客户观点。IBM加速发现实验室的研究员们准备利用品牌管理工具,从多个角度来回答这个有趣的问题。2013年3月,8家全国性服装品牌被选作样本,IBM与Esri合作进行联合舆情监控示范项目。
为了设计舆情监控示范系统,Esri的开发人员花了一天的时间与IBM的研究员们进行讨论,实验室中所有的软件、数据和专利技术都对其开放。最后,利用Portal for ArcGIS和ArcGIS for Server,Esri开发了一套交互式地图应用,通过位置和时间可视化Twitter用户数据。这有助于实验室定义Tweets内容模式,对人口统计资料和客户类型进行更直观的认识。IBM的社交媒体分析方法可以解码客户观点、位置及心理语言等各种属性,可以按地区对服装品牌形象进行评价。通过IBM加速发现实验室的算法,可推测出未包括在Tweets中的Tweets发送者的概要信息,如性别及个性特点等,并显示在地图底部。从下拉菜单中选择参与服装品牌,在不同零售商之间轻松比较Tweets提及率和及其客户特点。从更微观的角度,实验室的心理分析与来自Esri Tapestry人口统计数据分析可以并发执行分析得出结果,这个结果可以整合买主本质特征,在个体层面进行数据梳理,为品牌经理提供了一个客户关系管理的超强工具。
监控危机范围
Esri及IBM舆情监控示范实验分别按照品牌的正面提及和负面提及做了划分,并在地图上显示出来
对参加舆情监控实验的一家服装零售商而言,2013年的某一周就像是永远。2013年,该公司因某签名品牌的服装的一个瑕疵而遭到了连珠炮式的投诉。
可以预见的是,在美国某些地区,通过Tweets活动进行品牌监测的现象会增加,这些地区的位置将在舆情监控地图上表示出来。通过地理位置显示Tweets信息,可以了解不同地域的人们对产品瑕疵的反映,对社交媒体进行分析可以为在出现危机时第一时间实施品牌管理提供有利的实时信息。
“GIS可帮助确定问题的范围。”IBM加速发现实验室研究人员兼数据整合专家Mary Roth说,“结合我们的分析,Esri可快速确定这股Tweets风暴来自何方,比如说,如果只是来自罗德岛,地理处理数据会显示出该问题只是地方性问题而没有蔓延至全国。重要的是,这样的信息最终会降低响应成本。”
舆情监控示范是从Twitter信息源中提取和展示分析结果的最简单有效的方法。一旦Tweets信息的价值被发现,品牌经理就可通过研究Tweets发送者的个性特点和人口统计资料进行深入的数据挖掘,但是显示在地图中的数据不会泄露任何用户的隐私。这种方法为各公司彻底了解其客户提供了依据,并借此量身定制其品牌形象,更快、更有针对性地对品牌危机做出反应。
针对所有人的大数据分析
尽管有点吓人,但数据洪流仍为以前不可能进行的研究创造了新的机遇,而不再是陈旧零碎的分析。舆情监控仅是大数据研究的冰山一角,Esri和IBM目前正在设计新的大数据分析方法,该方法将地理分析与其合作研发的方法体系结合在一起。今年,Esri将在进一步加强在此领域的研究,并将发布一系列革命性的针对大数据研究的新工具和方法。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06