京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析:解读数据?解读“人”!
一提到“数据”,可能经常会想到“数字”、“图表”、“模型”、“方程”等容易让人怯步的词语。其实“数据”的真正意义,是躲在背后的那些“人”。
在营销学中,市场的根本在于需求,需求由人而生。因此,我们不应该就数字而数字,就算法而算法,应该自始自终关注“人”,市场研究则更是如此。
有人也许会说,“人”可不好说,有时说谎,有时偏私,真真假假。但,不是有种更简单的想法吗?我们自己本身就是“人”。作为市场研究者,大可不必将自己完完全全剥离在“人”这个概念以外,顶着看似客观的立场,作困兽之斗。
这个时候也许有人会质疑,如果加入更多自己的想法,你的研究还客观吗?
没错,作为市场研究者,必须客观地看待事实,呈现事实。但事实是什么,如果总把自己孤立在另一边,恐怕这个所谓的事实,也不过是披着云雾的谜团。
在这里,我必须强调,事实的重要性,正是为了看清事实,我们必须“有方法”地在某些情况下,将自己看成是同一边的“人”,某些情况下,将自己独立为另一边的旁观者。
这个“方法”,正是这篇文章试图总结的东西。
1. 在用户没有表达任何观点,或,还不清楚用户的观点之前,不要有任何想法。
我们不妨恶俗地将自己比喻成“蛔虫”,主人都还没有想法,就算你是肚子里的蛔虫,也不可能会知道些什么。
所以,我们需要开放式问卷,引诱我们的主人试着讲他们的想法,哪怕只是一点点。这就是所谓的定性阶段。
2. 拿着用户的文字反馈,尝试读懂这个“人”,而不是这些“字”。
当问卷回收了,我们“看到”主人们用“文字”写下来的话。这就有两个问题:
一是,开放式问卷数量很多,意味着主人很多,口味各不相同;
二是,文字的运用可能基于主人们的不同背景或个性有所不同(写的不同),而由于有自己的背景,我们“看”的方式与主人们的表达方式也有所不同(看的不同),结果必然导致信息传递的缺失(最形象的比喻是,接力比划游戏,结果往往啼笑皆非)。
这个时候,我们作为同一边的“人”,可以出现了。
看着那些留在卷面上的文字,试想一下,那个“你”到底想说什么?这个时候仿佛可以读懂些什么。但必须说明,这个时候的“你”只能是文字背后可能的那个人,而不应该有任何你的自我存在影响着判断。
举个简单的例子,有两个玩家同时说,你的游戏太耗钱了。请好好看看他们的等级,他们的角色,他们的收入/职业等背景信息,你可能会发现一位是中级,一位是高级,一位是肉盾,一位是魔法师,一位是学生,一位是蓝领。
我们试着代入,如果你是中级肉盾,在这个游戏中会面临怎样的情境?因为游戏规则,你常常与高级玩家PK,结果是PK时常常输掉(挫败感过强),归根到底是因为你的角色只是中级,然后会想“如果我练到高级了,就不怕跟高级玩家PK。”最终,频繁花钱练级,花了钱,却发现永远不可能追上高级,那时正好有个问卷弹出来,你毫不犹豫地说“这个游戏太耗钱了”。
另一个角色,如果你是高级魔法师,因为你等级高,攻击力强,很多人组你打副本,副本对你而言很简单,但手机端的页面总是复杂而庞大,一晚下来,流量用了一半。第三晚开始,队友喊你,你就得用套餐外流量去参与同盟军。两个礼拜之后,月结日发现话费用了100块在超出的流量上,这时你收到一个问卷,你义愤填膺地说“这个游戏太耗钱了”。
上面的例子是想说明,当你读懂了文字背后的那个人,你会发现前者的“耗钱”根源很可能是玩法的成就感缺失,后者的“耗钱”根源很可能是页面的联网响应,二者讲的可能完全不是同一回事。
3. 倾听着用户的话语,与其跟他说话,不如听懂他的话。
有人可能会细心地看到,上面我用了“可能”下结论,说白了,这种代入只是“猜”,你没有任何证据证明这个假设是对的。
没错,不记得哪位名家讲过“大胆假设,小心求证”。如果说前面是如何用“代入”来大胆假设,后面则是如何用“代入”来小心求证。
有了一些粗糙的想法后,作为市场研究者,内心充满了激动和好奇,没有人比我们更想知道自己的假设或想法,到底对不对。这个时候,千万注意,收起我们的激动和好奇。这种先入为主的情绪会成为我们发现事实的障碍。
前面只有文字接触,接下来不妨亲自与用户对话,形式是多样的,电话,面访,现场测试等等。用近乎苛刻的连环追问(这里有技巧,追问的代价绝不能是用户厌烦),让用户自己把自己挖透彻,这个过程可能是痛苦而艰难的,所以你的“代入”变得很重要。只有让用户感觉到,作为同一边的“人”的你存在,他才会愿意做挖掘自己这种艰难的活儿。
案例分享:桌面上放着几款不同品牌的,容量相同材质不同的奶瓶。
请一位中低收入家庭的全职妈妈在挑选的两个中最终选出一个,并且说出原因。两个备选的奶瓶分别是:高端品牌PP材质、一般品牌玻璃材质。最终她选择了一般品牌玻璃材质。她告诉我们,PP材质不知道对小孩好不好,而且自己是全职妈妈,可以照料玻璃材质的,玻璃更安全。
几个环节之后,我们加入这样的内容“为了感谢您,我们额外送您一个赠品,请你随便挑一个带走吧。”结果,她选择了高端品牌PP材质。
这时,你试着代入中低收入家庭的全职妈妈角色,似乎更能读懂她的行为,这个高端品牌可能还是值得信任的,根源可能不在材质上,而在价格上。
有了这个想法,追问她“送人吗?还是BB用?送人我给你包装一下,BB用的话可能加个把手好一些。”
这时她告诉我,“谢谢你,那帮我加个把手吧,高端品牌就是讲究啊,我也给BB试试看。”(表情轻松愉悦)
“试过如果好的话,可以回头光顾哦!”
她稍微用力眨了一下眼睛,扬起了嘴角“呵呵,好,我们先试试~~~”。说到这里,你懂的了。
(话说回来,真诚建议市场研究人员也不妨修炼一下表情动作的心理投射)
4. 与其单独看每个数字,不如串起来读下去,完整地读出一个“人”。
从开放式问卷的广度,到与用户对话的深度,我们一直在拼凑和补充材料,“代入”除了帮我们读懂“人”以外,也帮我们描绘了可能存在的问题,可以通俗地理解为“准备上桌的菜”。这个菜到底能上不能上,材料是不是最终做出这个菜,还得继续“小心求证”。
来到定量问卷阶段,将你的材料组织好,送到用户面前,让他们决定,他们想要什么。用户反馈回来之后,我们进入数据清洗、分析、解读阶段。
这里说一下“解读”。
送到我们面前的是一堆数字,一堆图表,我们任务不是告诉大家这个数字是多少,而是数字代表什么。
第一件要做的事是,将自己每种假设的相关数字聚集起来,考察它们是否可以串成链条(俗称“证据链”),如果可以,很好,假设成立。如果不可以,研究一下,假设的漏洞在哪里,也许会发现一个新的结论。
第二件事是,将用户视角下的诸如行为路径、态度轨迹、需求满足过程等链条相关的数字串联起来,看看是否能完整描绘出“人”的形象。如果可以,很好,又一个结论浮现了,如果不可以,检查一下矛盾或缺漏点在哪里,也许会发现用户分类方法不对,另外一个细分维度可能更有效。
举个简单的例子,你有用户对皮肤的元素、颜色、风格、主题的偏好,串联起来,加上一个合适的细分维度对比分析,会发现年龄不同的用户,社会沉浸经历不同,总体风格偏好也存在差异。再类推延伸一下,会发现社会沉浸经历可能会投射在更多其他领域的偏好上。
有人可能会问,这里好像没看见“代入”。其实,在你做的两件事里面,就已经有“代入”。组织证据链、剖绘形象人这两件工作,需要很好地读懂选项占比以及填选项的人,才能做好。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22