京公网安备 11010802034615号
经营许可证编号:京B2-20210330
1:淘宝的用户反馈 入口
PART1 理论基础:内容分析法简述
内容分析,是指利用明晰的编码规则,将大量文本信息转化为定量数据,并 归于若干类别以分析信息特征的方法)。内容分析有三个特点:
1)客观性。内容分析不受主观偏见影响,有标准化的研究过程,研究员对结果持开放态度;
2)系统。内容分析过程(取样、分析、编码等)有统一、标准的规则和程序;
3)定性与定量结合。内容分析通过定性研究找出能反映内容本质的特征,又将文本转化为定量的数据,分析 结果可用频次、百分比,或相关系数等来表示。
这种研究无需直接接触研究对象,在传播学、情报学、教育学等社会学科有广泛应用,但目的有所差别。鉴于本文所述的应用类型,更倾向从情报学的观点去定义内容分析的目的:通过分析内容了解本质性的事实和趋势,并揭示隐性问题。换句话说,在用户反馈分析中应用内容分析法,目的在于对反馈信息进行系统的归纳分类,整理问题点并评估其严重性,从而有针对地实施改进。
内容分析的基本流程如图2所示。科研中,还有训练编码员(5、6环节间)、测量编码员之间可信度(6、7环节间)的步骤。在企业环境中由于受到时间等调研成本制约,可选择性执行这两步。具体每一步的实施将在PART2中通过实例详述。
图2:内容分析流程图
PART2 实践应用:步骤与技巧
如前所述,在企业的用户研究中利用内容分析处理文本型用户反馈数据,最终目的在于,通过科学有效地总结归纳问题来促进改进。因此应用文本分析的步骤和技巧有以下特点:
1)编码员(用户研究员)需要对产品/项目的功能等特征有充分了解;
2)抽样的时间点,会根据产品/项目的特点而定,如有无重大改 进等;
3)分类以及后续数据分析维度的建立,是研究员与产品经理等项目组关键成员共同完成的;
现按照前文所述的分析流程,以旺铺升级后一周内的用户反馈分析为例,介绍内容分析在企业用户研究中的实践步骤。
【第一步 对分析的目标和范围做出准确定义】
分析目标:收集、归纳用户体验问题及用户看法
分析范围:
主题领域——以某产品,或某流程的用户反馈为范围
时间段——如,改版后一周内、新上线一 周后……等。值得注意的是,在产品大事件(如发布、改版)时间段,收集到的问题会较多,用户反馈两极化明显。在系统大事件(down机等)时间段,反馈的 问题会较集中,用户反馈多为抱怨。
呈现在用户研究报告中,也就是一句简短陈述,如:旺铺升级后一周内的用户反馈总结
【第二步 决定抽样样本】
包括决定以下三方面
1)内容源:选择从什么地方(帮派?问卷?…等)抽样
2)时间:选择在分析时间段的哪几天(全段?隔天?隔周?)抽样
3)内容:对内容进行随机或等距抽样
这意味着研究员要对产品周期有充分的了解和认识。在本例中,我们的抽样样本是,旺铺升级后一周内 (7天)用户通过旺铺装修页面“提意见”入口(图3)提交的所有数据。
——>
图3:旺铺用户反馈收集入口
【第三步 确定分析单位】
分析单位是内容分析中的最小元素, 要对此给出明确清晰的操作性定义。在本例中,分析单位就是一名用户所陈述的一条意见。值得注意的是,并非以一次提交的数据为单位,因为一名用户一次性可能 提交若干条意见,需要把意见拆开,每条为一个分析单位。如图4所示,“删除模块删完不能添加”、“发布完又回到装修页面”分别是一个分析单位。
图4:分析单位举例
【第四步 建立分类】
分类是内容分析的关键步骤,决定了后续的定量分析的有效性。类别是内容分析的基本单位,每个分析单位都能且只能归入某类别中。在学术研究中,往往依据研究理论或参考过往研究结果来分类。在企业用研中,则要对产品有充分了解,并与产品经理合作制定分类框架。因为这便于分配问题解决负责人。
穷尽、互斥是分类的两大原则。分类应涵盖可能的问题范围,但由于事前无法全面预知内容,最好设立“其它”类以满足穷尽性。若有≥10%的 分析单位被归入“其它”,则分类不当。类与类之间是不重合的,若有一个分析单位可归入两个或以上类别,则分类不当,或分析单位不准。
分多少类为合适?类别太多会导致某些类的分析单位少而失去统计意义;类别太少,不同性质的分析单位归入同一类,可能会掩盖显著性差 异。考虑到将分类合并比将分类拆分容易,建议宁多勿少。在无从下手的情况下,可试检验50-100条分析 单位。
在本例中的分类如图5——
图5:旺铺用户反馈 的分类与说明
该分类倾向于以问题解决方(如系统问题由开发人员解决、功能需求由产品经理解决、交互问题由设计 师解决)为基础维度,便于推动改进。对于页面、功能有限的产品/流程,也可按照页面或功能分类。对于本例,也有针对功能、页面进行分类,主要体现在二级编码中,详情见下。
【第五步 制作编码表 试验性编码】
制作编码表是在大分类的基础上进行 细化,以更好地聚焦问题。在这一步,要尽可能细致全面,才能保证有效的数据分析。对每个编码的含义要有所说明,尤其在编码者不止一人的情况下。在本例中, 对功能需求这一大分类的部分编码如图6,其原则是尽可能涵盖所有功能。而对于系统问题、交互体验问题,子编码 又是应内容特点、以另外的维度设定的。
图6:编码表示例
在 编码表制作好后,抽取50-100条分析单位(如100条反馈)进行试编码(coding),以检验是否够细够全。当然了,在实际实施编码(第六步)过 程中可能发现编码不够用的情况。此时只能新增编码,并对该分类下的所有分析单位重新编码。所幸的是——也是内容分析的优点之一——即使发现问题,能在不影 响数据本身准确性和完好性的情况下弥补错误。不像问卷调研或现场实验,一旦实施,有错误也无法弥补,只能抛弃数据。
【第六步 收集数据 实施编码】
收集数据就是按照之前所定义好的范围与抽样 标准提取数据。通常将数据导入到EXCEL中进行处理。在本例中,每条用户意见(即最小分析单位)对应一行(图7)。
图7:原始数据示例
然 后便可开始对每个分析单位进行编码,是纯人工的过程。目前也有一些文本分析软件可辅助,但这些基于分词技术的软件智能程度不足,且实施聚类分析对样本量有 要求(至少上万条),更适合用于海量文本数据的分类。
编码过程可借助EXCEL的文本筛选功能。比如笔者用得较多的是“包含XX关键词” 的筛选方式(图8),能有效提高编码效率。在过程中要把无意义的分析单位(如在本例中,会有用户在反馈中打自己店铺的广告)给清理掉。
图8:文本筛选功能 示例
初步编码结果如下图所示,接着便可进入分析、报告阶段。
图9:编码结果示例
【第 七步 分析 报告结果】
分析包括两部分。定量部分使用描述性统计,计算各分类中条目、各个码类的频数、百分比。如果还能结合到其他变量,如用 户的星级等,可进行更复杂的交叉分析、卡方检验、t检验、方差分析等。定性部分,是对某子编码下的所有条目进行梳理,总结出问题点。
要注意的是,频数、百分比不是衡量严重程度的唯一指标。比如我们发现大量系统问题这一分类的用户意见,但基本上说 的只是发布失败和速度慢两点。 功能需求这一分类下的意见总数相对较少,但问题有10余种。因此,定性与定量分析的结合,才能反映各分类对整体体验(满意或不满意)的贡献度大小,以及问题聚焦/分散程度。示例如下:
图10:反馈总结示例
进 一步的分析还包括对表象所隐含的问题的推断。例如笔者发现图11所示的问题。
图11:深层分析示例
在企业中,内容分析报告的输出形式更灵活,关键在于有效传达问题,推动问题的解决。尤其用户反馈的内容本身比用户研究员的分析归纳更具冲击力,更易引起同理心。
在本例中,笔者的输出物包括:
原始数据EXCEL表,按分类将问题 分别放在不同sheet里(图11)。在每一张sheet里,可通过筛选功能,看具体某个方面的用户反馈原话。要注意的是,此时会把编码重新转化为文字描述便于理解。
图12:EXCEL 输出物示例
用户反馈总结ppt,将各分类中的问题汇总罗列,用于向项目组宣讲,并探讨解决 方案。陈述问题时,可引用典型的用户原话。比如有10个人反映同一问题,可选取问题表达最清晰或感情色彩最浓烈者的原话。本文来自:CDA数据分析师
本文介绍了内容分析,以及内容分析在企业 用户研究中应用的步骤与技巧。内容分析的优点有:1)相比实验法、问卷法等,较为节省人力物力;2)内容可被重复分析,可靠性较大;3)无需直接接触研究 对象;4)操作过程若产生问题,错误易被弥补。它的缺点在于:1)人为因素(如如何分类、编码)会极大影响结果;2)编码工作需时较长、单调。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04