
学会使用数据而不是在数据中沉沦
死亡数据轮的四个阶段:
如果“死亡数据轮”的以上四个阶段你看起来很熟悉,并不是你一个人这么认为,我估计任何公司三分之二的数据经过这四个阶段后都会变成无效数据。
这将会产生麻烦。因为数据在自身的增长过程和人的心态中都起着关键的横向作用。没有质量好的数据,一次合理的实验周期就不可能运行。
今天,我将阐述看上去良好的数据却在使用中经常导致失败的4个原因,以及你可以为此做些什么。
问题1:项目心态与流程心态
大多数想要更加认真对待数据的公司将数据视为一个项目:这个项目有一个明确的开始和一个明确的结束。
当你将数据视为一个项目时,你将获得“死亡数据轮”。
项目掩饰:当某些时候有人发现一组看起来像不正确的数据。由于他们不相信这组数据是正确的,所以他们会停止使用该数据。因为没有人在使用数据,所以数据不会持续-这将会导致更多对数据的不信任。
在上述情况下,把数据视为一个项目去处理是错误的。实际上,类似于构建产品,数据是一个持续的,永无止境的项目。
数据作为产品
阶段1:数据收集->阶段2:衡量数据输出的影响->阶段3:从什么是数据或者数据未被使用中学习
你的数据需要在一个持续的过程中进行完善和更新,原因如下:
1.你的产品会改变
产品的功能在这个过程中将会持续改变。随着产品功能的发展,你的数据也需要保持同步更新,否则数据将变得无关紧要或者数据会存在缺陷,人们将失去对数据的信任,将导致“死亡数据轮”继续下去。
2.你会改变对业务的了解
数据应该引导你产生对业务的事项进行排序的见解:优先考虑某些事项,其它事项随后考虑。
Andrew Chen说:“你的数据和关键绩效指标应该是对你的策略的反映。”就是说你的策略会随着时间的推移而变化,追踪和分析则需要随着策略的发展而变化。
3.新的答案揭露出新的问题。
你从数据中获得新的洞察力,打开了新问题的大门。因为你有新的问题,所以你需要更新你的指令和分析。这个过程“完成”了,也就是说你要了解过程中每一件关于你的用户,产品和渠道的事情。
4.休息没有意义
这很简单。
因为数据不会终结。
人们会花更多的时间分析使用哪些工具来处理数据,而不是去调整和更新数据。
项目心态是隐藏在数据背后的一种心态,并且该心态会与“首次做我就必须要做正确”的心态相联系。该心态的问题在于:如果你没有完美的数据处理工具,最终你对数据的分析会以分析瘫痪结束。
如果你将数据视为一个持续的过程,数据将不会被定义结束。随着新需求的出现,你将会更容易的陷入到重复处理数据的过程中。
你该怎么办
你应该为数据收集和分析分配专用资源,而不是去使用一个一次性的,只基于该项目能使用的数据方法。
公司发展的早期阶段,分配专用资源可能是工程师或项目经理需要花时间去做的一件事。无论花费多少小时(即使仅仅花了一点儿时间),该步骤都是他们作为工程师和项目经理应该做的所有事情中的关键部分。
公司发展的后期阶段,你很可能需要专门的团队来维护数据流程,包括构建和维护数据基础架构,以及促进数据的使用。
重要的是你要记住,数据处理进展顺利不仅仅是依靠指令来完成。你需要做的其他工作是同组织内的数据消费者建立信任。你至少需要在一些报告中花时间来验证这些数据,并与你周围的更大的团队进行合作,以确保他们了解并信任他们所看到的数据。
如果他们不信任这些数据,他们就不会使用这些数据。
问题2:激励的偏离
即使你将数据视为了一项进程或者一个项目,也不一定意味着你会成功。有些公司在基础设施,工具和指令上花费了太长的时间,但是他们忽略了一些非常重要的事情。
让组织去使用数据需要个人的行为变化。
改变个人的行为非常困难。缺乏改变的背后通常隐藏着一个罪魁祸首:激励和奖励的偏差。
团队和个人将最终获得他们应得的奖励。如果你想改变他们的行为,你必须确保改变后的行为是他们能够获得奖励条件的一部分。
奖励有多种类型:
环顾你的团队,你多久会给予他们一些关于使用数据的奖励?
问题如下:
如果他们使用数据没有得到奖励,那么他们对数据进行分析和分析时所使用的工具都将被视为他们获得奖励或被认为完成一项好工作的阻碍。
如果他们对数据的使用得到了奖励,那么他们为数据合并所做的工作就成了他们完成一项好工作的盟友。
然后你要问自己第二个问题:得到的奖励与你给予奖励的其他东西有多大的相关性,或者多久能和其他东西联系一次?
与其他奖励的重要性或者优先级相比,要考虑到数据的使用有多大可能性或者是否经常能够得到报酬。经理们需要注意如何将不同的权重因子作为奖励的一部分。
该怎么办
1.每个团队都需要一个关键绩效指标(KPI)
每个团队需要一个KPI作为衡量他们成功的一部分。为每个团队制定一个关键绩效指标,将数据的使用用于工作中和把定位数据看作一个摩擦点。
只设置KPI是不够的,还需要做3件事情:
通常情况下,只有项目经理或团队中的几个人真正了解它。
KPI需要成为获得四种奖励的一种,但它不是团队获得的唯一奖励。
对产品团队来说还有其他重要因素,如运输速度,产品质量等。同大多数情况一样,这些因素都是为了平衡团队。
2.为每种奖励设计系统
通过四种奖励类型和设计系统中来奖励数据的使用。这里我说的系统是什么意思?
这是一个关于授权认可奖励系统的快速示例:我知道的最好的经理都有每一次对员工一对一问卷调查所准备的清单。清单上的项目可能会是“这个人是否在工作中使用了数据?”
如果员工在工作中使用了数据,请务必给予他认可。除非你给予看到他使用数据的具体指示,否则这件事太容易被忽略了。
3.清楚沟通奖励
不要认为你的团队成员都知道他们怎样做才能得到赞美,奖金和晋升机会。你需要将这些做法落实在书面上:做出一个明确的,强化的方案。你必须过度沟通才能使该方案通过。
当你赞扬某人时,不要只是说类似“恭喜Jane Smith晋升为高级产品经理”这样的话。要在赞扬中举一些例子来说明他做了什么导致她的晋升。
问题3:数据团队成为瓶颈
如果你在解决问题的过程或项目中,你的激励和使用数据开始变得有价值,将会出现一些新的问题。
第一个问题是数据团队可能会以出现瓶颈来结束过程或项目。这源于数据团队对数据采取“所有权”的心态,即“我们拥有数据”的心态。
但是这种“所有权”心态忽略了重要的一点:
每个数据团队都有一个“客户”。
数据团队的客户是其他公司内部使用数据的人:数据分析师,产品经理,工程师,营销人员等。
为了服务这些内部客户,数据团队需要像其他产品团队一样行事:
定义他们的客户群
了解客户需求
提供最引人注目的解决方案
必须迭代!
换句话说,数据团队不能独家拥有数据,他们的数据输出必须能够让其他团队数据输出。
问题4:辉煌的答案,无用的问题
一旦数据变得有价值和被人认可,就会出现第二个问题:人们开始利用资料提供数据。无论是因为他们发现使用数据的过程机智又迷人,或者只是使用数据让他们本身看起来聪明且工作效率高等等。这就是数据的力量:)
为了数据去寻找数据是一个诱人的陷阱,但它只创造了“为无用的问题提供辉煌的答案”,谷歌的用户增长和分析的负责人,同时也是脸书分析的前负责人Ken Rudin提出该观点。
Rudin提醒我们,尽管增加知识存在着吸引力,但只有发现知识的洞察力是不够的—结果和影响才是分析的真正目标。为此,数据团队应该确保他们提出正确的问题,而不仅仅是为问题提供越来越多的答案。
对如何创建一个实际提供业务需求的数据流程,Rudin有如下两个建议:
1.雇用有商业头脑的分析师,不只是关注数据或者使用工具。
当你面试分析师候选人时,不要只关注“我们如何完成这个指标?”要问他们:“业务中你认为哪些指标重要?
2.把使用数据变成每个人都要做的事。
Rudin在Facebook的数据团队为公司的每个人都运行了两周的“数据营”。该数据营为更广泛的组织提供了一种共同的语言来描述数据可以回答的问题。
通过提出一个可靠的,能对业务产生影响的好问题,Rudin还会提供一个坚实的数据流程。(Rudin也非常重视数据团队必须对“可行的见解”和应该采取的必要措施负责)。
数据提供的答案和行为,有助于形成更好的问题。
随着数据的答案转化为影响,人们将被激励维持进行数据工作,甚至改进数据系统。这些行为导致更多的数据容量,为形成更好的问题提供强有力的答案。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08