
在运营中,为什么文本分析远比数值型分析重要?一个实际案例,五点分析(下)
本文是《数据分析中,文本分析远比数值型分析重要!》的下篇,以一个实际案例来聊聊文本分析在实际运营中如何落地。行为脉络如下:先简要讲述文本分析的分支—情绪分析的基本原理,然后以亚马逊的Kindle Voyage的用户评论作为“情绪分析”的实操分析,最后罗列了几个实用的文本分析工具,以期对大家有所帮助。
在大数据时代还未来临前,企业一般根据自身积累的历史数据,以及一线运营人员的主观经验来猜测用户接下来的反应,以此作为制定后续营销、运营方案的依据。
然而,在这个VUCA时代(宝洁公司首席运营官Robert McDonald借用一个军事术语来描述这一新的商业世界格局,即volatility,易变性;uncertainty,不确定性;complexity,复杂性;ambiguity,模糊性),商业场景的变化速度和复杂程度今非昔比,用户的喜好也容易受外界“场景”的影响,就如“孩子的脸”和“六月的天”一样善变,先前积累的经验往往不足以作为企业下一阶段进行市场谋划和运营的依据。
VUCA时代的特征
根据《数据运营|数据分析中,文本分析远比数值型分析重要!(上)》的分析,我们可知,大数据文本分析正是应对上述困局的一剂良方。
(一)
接下来,我们将从理论到实践,聊聊文本分析是如何应用在商业实践中的。
借助基于大数据的文本分析,我们可以对用户行为和想法进行科学分析,使用户洞察由原来的主观“猜测”转变为以数据为驱动的精准预测。在新产品上市前,或者是小规模投放市场后,在社交媒体上对粉丝和潜在用户的言论进行收集,对其进行文本分析,知道他们喜欢产品的哪些方面,对哪些方面不太满意,以及他们对产品的其他期望,从而敏捷、快速、准确的对用户的反馈做出积极的回应。
由此可见,有文本分析介入的产品运营流程被“重构”了,如下图所示。
有文本分析参与的运营分析逻辑流程
其中,对用户言论进行文本分析的“精髓”在于对提炼出的文本数据的所表达出的“情绪”的解读,也就是用户言论的情绪分析。
在理解文本分析语境下的“情绪分析”前,我们先看看它的一般含义。
先说“情绪”。“情绪”这个词,在心理学中的一般含义是:对一系列主观认知经验的通称,是多种感觉、思想和行为综合产生的心理和生理状态。我们日常中最普遍的情绪就是喜、怒、忧、思、悲、恐、惊,也就是中医中所说的“七情”。
那么,“情绪分析”就是有效且准确的识别这些具体的情绪,根据得到的结果,进一步对产生于自身或者他人的情绪采取合理的应对措施(如疏导自身消极情绪、理解他人的反常行为等)。
与此类似,基于大数据文本数据的“情绪分析”,也被业界称为“观点挖掘”,它利用多样化、海量的社会化媒体做客服,借助数量庞大的社交网络平衡语料和新闻平衡语料的机器学习模型,对所获取文本中的情感倾向和评价对象进行提取,使运营者更全面、更深入地了解用户的“心声”,掌握用户对于产品的喜好程度,及用户视角下的产品优缺点。
值得注意的是,基于大数据文本的情绪分析在于深度分析评论的意义(评论的是事物的哪些方面)以及附带的情绪倾向(是“褒”是“贬”,还是“中立”),而不是评论本身在说的文字。
下面,笔者将以基于亚马逊上Kindle Voyage商品评论的文本数据为例,来聊聊文本数据的情绪分析在商业实践中的运用。
现在,笔者以亚马逊官网2014年9月份在其平台上发售的Kindle Voyage电子书阅读器珍藏限量为例,对其商品评论区的用户评论进行基于文本数据的“情绪分析”,看看我们能从中得到哪些有价值的insight,以便优化我们的运营工作。
亚马逊官网上Kindle Voyage电子书阅读器的商品详情页
分析时间段:2014.12.01~2015.06.23
数据来源:亚马逊官网上Kindle Voyage电子书阅读器商品评论区
意见领袖总数(评价者):1675人
原始评价:2720条
详细评价信息(包括对评价的“回应”,即评价的评价,如此循环):4659条
亚马逊Kindle Voyage电子书阅读器珍藏限量版评论区
(二)
笔者将从以下5个方面,即用户聚焦点分析、用户反馈趋势分析、用户情绪分析、用户反馈分析,以及各地域用户评级分布及情绪分析,对Kindle Voyage亚马逊商品评论区的4659条用户留言/评论进行文本分析。
对Kindle Voyage用户评论进行文本分析的几大模块
大数据文本分析中的“典型意见”是指,将用户的意见进行单据级别的语义聚合,将内涵相近但表述有差异的意见/看法聚合在一起,抽取出其中典型的用户反馈/意见,在短时间内迅速梳理出用户对于产品所关注的话题。
用户评论的典型意见分析
从上图可以看出,通过对这些用户留言的典型意见进行分析,再结合Kindle Voyage的商品详情描述,我们可以了解到用户对于Kindle Voyage的评价主要集中在以下7个方面:
捆绑销售策略(话题1)
限量发售策略(话题2)
屏幕显示效果(话题3)
原装配套皮套(话题4)
与其“同族兄弟”kindle Paper White的比较(话题5)
屏幕的亮度自动调节功能(话题6、话题7)
售后客服评价(话题8)
关于用户对这些话题的具体评价和情绪感受,我们需要做进一步的分析。
用户反馈趋势分析曲线展现了文本数据量在时间上的分布情况,可以从宏观上掌握上述8个话题所对应评论(量)的发展走势,以便做好及时跟进,发掘出其中有价值的言论。
下图中,从下至上,依次是话题1到话题8的评论数量随时间变化的增减趋势。其中,评论量的大小以图形面积的大小来呈现。
用户评论量随时间轴的变化趋势
可以看到,这些话题的发布数量的增减走势基本相同,且在2015-3-1达到评论高峰,2016-1-25达到小高峰,这两个时间点的前后数天的购买人数激增。然而在2016-4-24这一天商品评论区的总体评论量骤然减少,对于这几个异常点,运营人员可以调出对于日期的销售记录、商品维护日志等资料找出原因,以便对症下药,做好后续的运营工作。
这部分包含2个模块,即用户评价和情绪分析,二者存在一定的正相关关系,也就是说,用户评价较高,相应的情绪偏正面,反正亦然。
(1)用户评价分析
用户评价星级占比图
从上面2个图可知,超过63%的用户对于Kindle Voyage的产品性能是非常满意的,给出了5颗星的评价;次之的四颗星评价占到19.15%的比重,以上二者比重之和超过80%,可知Kindle Voyage总体的市场反馈非常不错。
(2)用户总体情绪倾向分析
用户的情感度分布
上图是用户对于Kindle Voyage总体情感的仪表盘,是根据用户对于Kindle Voyage的文字评论进行情绪倾向分析得出的,能反映消费者对于Kindle Voyage总体态度是肯定还是否定。该仪表盘分为3个大的方向,即负面情绪、中性情绪和正面情绪,其中暗含的用户态度就是对产品不满意、产品一般和产品很不错。
从上面2个图可以看出,购买者对于Kindle Voyage以中性评论为主,情感正面值为1.06,总体情感偏向于正面,说明大家对Kindle Voyage的真实看法与评价星级总体倾向是一致的,没有言不由衷。
上面的是全体用户对于Kindle Voyage的总体情绪倾向,但在很多时候,我们想要知道哪些用户的“发声”在这些评论中更具代表性。这就需要分析引擎在语义层面上对每个用户进行重要性排名,从中发掘出有“话语权重”较大的“意见领袖”。
更进一步,我们要对其中单个用户的情绪态度、评价和所关注的产品方面进行分析,这就涉及到以单个用户为主体的情绪倾向分析了。
以下2个图分别关注的是意见领袖(用户)情绪分析总览和单个意见领袖(用户)的详细情绪分析。从中我们可以看到评论用户的名称、评论的数量、情绪是属性及相应的情绪数值。
用户(意见领袖)情绪分析总览
如果我们想对某个重要用户的情绪进行详细分析,我们可以点开这个用户的详细资料,进行深入的分析。如下图所示:
单个意见领袖(用户)的详细情绪分析
从上图中我们可以了解到为什么该用户对Kindle Voyage持正面态度(正面情绪用红色显示)了—下面的正面关键词云显示出该用户对Kindle Voyage的手感、屏幕显示和做工质量很满意。此外,在“焦点概览”里,我们可以了解到类似的评论有8条,在哪个时间节点达到峰值。
在进行上述分析后,我们还需要进一步读懂评论区的全体用户对Kindle Voyage的反馈,知道用户喜欢它的哪些方面,对哪些方面还不是太满意,以及这些(不)满意的方面的程度如何,这是“情绪分析”中的重中之重。
所以,我们需要进行下一步分析——用户反馈分析。
这部分的原理是,从众多用户评论中提取出跟产品属性相关且有代表性的关键词,并进行相似文本聚类,然后给出相应权重,最后匹配相应的情绪属性和情绪值。最终的结果使得运营者拥有了用户视角,知晓产品有哪些地方表现尚可,哪些地方反映平平,而哪些地方是需要进行改进和完善的。
下图是用户对于Kindle Voyage使用后的评论中提取并聚类的关键词云,其中文字大小代表该词的权重(重要程度和词频),字体颜色表明该词的情绪偏向(红色是正面评价,灰色是中性评价,蓝色是负面评价)。
用户的对于Kindle Voyage评论的主要关注点
根据关键词及其重要程度排名,笔者找到了用户满意的几个方面:
屏幕显示效果良好,这一点用户很是认可,“显示效果”、“分辨率高”、“看着舒服”、“字迹清晰”等关键词显示较大,此类评价的用户居多;字体为红色,表明用户反映的情感正面积极。
产品(及周边)质量不错,体现在“做工精细”、“续航能力”、“原装皮套”、“值得拥有”、“Ipad Mini(那样的做工)”、“实体翻页键(不错)”、“一分钱一分货”等关键词上。
“限量珍藏版“这个概念牌打得好,用户也愿意为此买单,这主要体现在“限量珍藏版”这个词频较高且为红色的关键字上。
另一方面,运营方也要及时了解用户的负向反馈,针对性地改进服务质量。
还好,在这里只出现了“压敏按键”这些负面词汇,点开“压敏按键”一词,看到用户的详细吐槽……“压敏按键在按下的时候出现下陷情形……”虽然这样的反馈不多,但仍要引起高度警惕,具体排查是产品本身的设计问题,还是极个别的产品质量问题,并将此反馈传递给相关负责部门。
将用户的反馈数据和评分同步到地图上,通过形成的数据地图可以直观的看到各地对于Kindle Voyage的评价和情绪度,从而对整体的用户反馈情况进行监控,重点“关照”其中的用户差评“重灾区”。
此处选取的是Kindle Voyage在江苏省各市的用户反馈数据,反映出该地区Kindle Voyage用户对于产品的评价及情绪倾向性。
其中,数值代表评分高低,颜色反映情绪值,绿色代表良好,蓝色是一般,红色代表处于警报状态,需要重点关注,排查问题发生的具体原因。
江苏省各市Kindle Voyage用户的评分及情绪度分布
这里可以看到,徐州市、连云港市等城市的用户反馈良好,反映在评分较高,且颜色为绿色。然而,淮安市、镇江市和南京市的Kindle Voyage用户却非常不满意,评分较低且情绪度处于红色警报状态,需要引起客户体验部门的高度重要,做好用户情绪疏导和公关工作。
结语
从上面的实例中,我们可以体会到大数据文本分析对于产品、设计、营销和运营的巨大价值,它的重要性不亚于传统的结构性数据分析。用正确的方式阅读这些海量的文本数据,我们就可以直接读懂用户的想法,获得强有力的决策支持,从而使产品研发、营销推广和日常运营更贴近消费者需求,最终在用户心中形成良好的品牌形象。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-252025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-25从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-25用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18