登录
首页精彩阅读你还原一个纯粹地道的「数据分析岗」
你还原一个纯粹地道的「数据分析岗」
2016-05-11
收藏

你还原一个纯粹地道的「数据分析岗」

为你还原一个纯粹地道的「数据分析岗」,你想要了解的一切都在这里!只要是在科技创新领域的公司,纷纷都挂出来了急招“数据分析师”的牌子。但是很多人对它的概念并不了解,本文为你一一道来数据分析岗的功能目的,以及组建方式,干货满满,诚意推荐!

数据分析行业现在大热,只要是在科技创新领域的公司,纷纷都挂出来了急招“数据分析师”的牌子。但是很多人对它的概念并不了解,还有更多的创业者更是不知道是否应该去组建一支数据分析团队,在什么时机组建?又以何种方式组建?本文为你一一道来。干货满满,诚意推荐!

这篇文章的作者是 Instacart数据分析副总裁 Jeremy Stanly 以及 Instacart 技术顾问(前 LinkedIn 数据分析部门总负责人)Daniel Tunkelang。

在 2008 年,很难想象还会有「数据分析师」这个职业。来自 Facebook 的 Jeff Hammerbacher 以及 LinkedIn 的 DJ Patil 发明了这个词,以应对横跨分析学、软件工程以及产品开发三个维度的综合性需求。如今,「数据分析师」这个行业越来越火了,似乎跟科技有关的各个行业都在找这方面的人才,寻找对数据分析有着清楚见解的专业人士。

我们两个人作为行业内人士,身处不同的科技行业,在若干个不同的公司,于若干的不同的发展阶段,见证了数据分析团队中的长处,短板,还有当下行业内各顶尖数据分析团队的做法。我们同时还亲身体会到了公司招聘一个顶尖的数据分析师有多难,而且在这个充满高度竞争的市场中真切地感受到,充分利用他们,留住他们又是多么困难的一件事。

在这篇文章中,我们给出了自己的一些想法与总结。对于那些致力于想打造一支数据分析团队的创始人来说应该有一点用处。我们解释了为什么现在对于很多初创公司来说数据分析是一件重要的事,什么时候公司应该开始做这件事,应该在公司的哪个部门应用数据分析,以及如何能够在公司内部构建一种让数据分析蓬勃发展的公司文化。

◎首先第一件事,你想要达到什么目的

总的来说,数据分析指向两个同等重要,但截然不同的目标:改进客户目前所使用的产品,优化公司所作出的每一个商业决策。

* 指向产品的数据分析:使用「数据学」以及「工程学」来提升产品的性能,尤其在「获取到更优质的搜索结果」、「推送更理想的推荐以及自动化决策」上面。

* 指向决策的数据分析:利用数据来分析商业指标,比如增长型、使用度、盈利驱动点、用户反馈,借此来找出当下最优的商业决策。

这两者的区别通过定义就能一目了然,但是每个人都不能掉以轻心,在你创办了公司,并且逐步壮大数据分析团队的时候,一定要将这两者的区别牢牢记在心上,且不可混为一谈,迷失方向。现在,让我们仔细观察这两个不同的领域。

◎利用数据分析来打造更优秀的产品

指向产品的数据分析,其目的就是为了提升产品性能。他们往往依托于一种良性循环,开发人员可以通过收集产品的使用情况方面的数据,最终通过一系列的算法,让用户获得更理想的体验。

在你收集到数据之前需要做什么?你第一版的产品估计会存在「冷启动问题」(数据分析领域的专有名词)。它必须开启一个达到了某个标准之上的使用体验,借此能够开启关于数据收集及分析上的良性循环。这取决于产品经理和工程师是否应用了更好的开发思路。

就比如说,当一个 Instacart 的用户访问了网站,应用会把「最近购买过的商品」放置到「再买一次」的下面。这个功能能够取悦用户,但是它很难让数据分析介入进来,又或者换句话说「产出足够多的数据」。数据分析什么时候起作用?就比如说我们要给用户一些推荐,推荐的商品是这些用户之前从来没有买过的。要达到这个目的,就必须分析所有用户的购买习惯,评估哪些用户跟哪些用户是类似的,最终将用户分组,然后按照他们购买过的产品,向他们推荐更适合他们心意,却从来没有买过的商品。这是数据分析学利用数据来产出价值的地方,让客户能够很方便地在线上商城不断地探索新的领域,这些都是他们自己浏览完全无法碰见的商品。

为了改善产品,数据分析师必须跟工程师紧密地团结在一起,持续不断地进行协作。作为创始人,你还必须要做一个决策:是数据分析师自己来提升产品性能呢?又或者是跟工程师联手合作?不管是哪一种方式,它们其实都能起到作用,最关键的是要将这个流程制度化,并把发现结果及时地分享给公司全体成员。如果你这一点做得不够好,你很难在产品提升上有什么起色,而且很多数据分析会因为在你的公司工作却看不到自己的价值,不受重视而灰心丧气地离开。

◎利用数据分析来做更优质的决策

指向决策的数据分析是利用「数据分析」和「数据视觉化」这两个方面,将最优的商业决策和产品决策展现出来。决策者可以是公司里面的任何一个岗位,他有可能是产品经理,用以决定现在产品路线图上工作任务的优先次序,也可以是高管团队,对目前公司的战略方向做出更清晰合理的规划。

指向决策的数据分析涉及好几个领域,它们都有几个共同的特点。它们都面临的是比较前沿的问题,公司在此前从来没有遭遇过,也没有想着去加以解决的。它们往往比较主观,需要数据分析师来处理一些未知的变数和一切缺失掉的客观条件。它们很复杂,里面的一些关键因素之间缺乏明显的关联关系。同时,指向决策的数据分析也是可以通过评测的方式来解决问题的。决策带来的正面结果是实实在在的,每个人都能看得见,且对公司的发展意义重大。

上面的这一番说法不禁让人起了疑惑,你说不就是「数据分析工具」嘛。确实,关于「分析」和「决策」,这两者的区别并不是很明显关于决策的分析学不仅仅是面向「报告」和「表盘」。而那些利用市面上现成的「商业智能工具」就能完成的工作,也不属于数据分析师的工作范畴当中。

在 LinkedIn,高管团队使用「决策上的数据分析」来做很多关键的商业决策判断,比如处理在搜索结果中的成员档案可视化问题。在过去,只有付费用户才能在拓展人际网络(三度人际网络)上看到每一个人的完整档案。这种可视化的规则在过去非常复杂,而 LinkedIn 想要简化它,但同时还要不能让它影响收入。这其中的利害权衡就显得非常关键。

他们计划让用户档案的可视化这样子处理,在未付费用户那里,一个月查看用户完整档案是有一定的上限次数的,而且基于每个免费用户的使用情况分配不同的上限次数。LinkedIn 的数据分析师模拟了这样的变动会带来的影响,利用用户过去的历史行为数据来预测收入上的变动,以及产品使用度上的变化。分析师必须在过去的固有模式上将用户的行为「抽离」出来,然后再把这些行为「安放」到新的模式下看它们会发生怎样的变化。结果证明这样做非常有助于公司的发展。

最后的结果正如模拟结果一样,不仅仅为公司带来业绩上的提升,而且还愉悦了数百万用户,在产品研发上面理清了方向。一些人曾经抱怨查看次数上面的限制,但是恰恰就是这群人,在 LinkedIn 的眼中是应该转化成为付费用户的一批人。这个项目非常成功,其中的关键得益于数据分析师所带来的「未卜先知」的神奇能力。

也不是说所有的决策都需要这么大动干戈地使用数据分析。一些决策其实很小,杀鸡焉用牛刀。另外一些决策很重要,但是恰恰公司在这个时候并具备充分的数据来分析它们。在这些情况下,公司必须依赖于某种商业上的直觉,以及后续展开的一些测试。优秀的决策型数据分析师知道自己的极限在哪里,当意识到他们的努力换不来相应的结果,甚至会带来副作用的时候他们会立刻中止掉工作。

尽管决策型分析又或者是产品型,它们都需要一些相同的技能。但是数据分析师不可能在这两个方向上都精通。决策型分析取决于产品和商业模式,系统性思考,还需要具备强有力的沟通技能;产品型分析要求具备机器学习的知识,产品层面的工程技术。如果你有一支数据分析团队,你也许需要找出那凤毛麟角地两方面都擅长的人才,但是这种情况不多件,更现实的考虑是,当你的团队不断壮大,各在一个方向找出一个专精于此道的数据分析人才。


◎你是否应该投资于数据分析?

数据分析并不是每一个人都适合,只有在它对你的成功起到决定性作用的前提下,你才想要去投资它。否则,它就会成为一个代价高昂,分人心神的邪路。

为了能够更好的确认你是否应该投资建设一支数据分析团队,你应该问自己下面的四个问题:

1. 你是否真的要专注于数据分析这个行当,要么打造更优秀的产品?要么凭此来做出一个又一个更加优化的决策?

如果你没有下决心来凭借数据分析达到上面两个目标中的任意一个,那么最好数据分析这个行业你还是不要涉足的好。

它是可以帮你做出战略性的决策规划,但是只有在你想要在全公司范围内打造一种以数据作为驱动的公司文化的前提下,一切才能成真。公司文化这件事并不一定从第一天开始做,但是你需要招聘正确的员工,并且花时间让他们知道数据的价值,你的公司的产品重心是什么。而让数据分析结果转化成为优质据测之前,你一定要完成上面的这些工作。

指向产品的数据分析学可以通过持续不断的优化,创造产品新的价值,并让用户得到越来越多的满足。数据分析师应该可以在产品设计、数据收集、系统底层架构等方面做出关键决策,从而给客户带来一款梦幻般的产品。

2. 你在未来是否有能力收集一切你需要的数据,并且将此作为行动的准绳?

一个身为创始人的软件工程师可以利一些在产品和设计上的创新思路,打造一款「最小可行化产品」的。而数据分析师手中的工具就是数据,这个数据有两个特点:首先它必须是可以收集评测的;其次它必须是不断规模化增长的。「推荐系统」就是要求你的产品能够追踪用户的消费行为,对商业决策的优化依靠的是在关键行为和产出上给予一些更加合理的指导。

但是收集到数据并不是全部内容,只有把行动建立在数据的基础上,数据分析学才真正有了意义。

数据应该指导产品变动,提升公司的关键性能指标。(KPI

在这个过程中,全公司上下的人都需要不断确认每一款产品所需要收集的数据都是什么,并且在收集和维护这些数据的同时,建立起一个更加牢靠的底层架构和流程。为了实现理想中的结果,数据分析师、工程师、产品经理三方应该联手写作,并且转化成实实在在的执行力。

同样,以数据作为基础的决策也需要公司自上而下的动员。从 CEO 一直到公司基层部门,公司应该一切以数据说话,而不是谁拿的薪水高就听谁的话。

3. 你是否在数据中来获取到足够多的信号?借此获得深刻的洞见?

很多人把大数据等同于数据分析,但是数据的规模并不意味着一切。数据分析是要将有价值的信号/迹象从「数据的噪音」中抽离出来的过程。而有价值的信号/迹象不仅仅依靠的是数据的规模,更重要的是「信噪比」。

举个例子,一款广告产品也许从也许能从几十亿次广告投放中获取信息,但是真正有价值的,承载「信号」的数据出现在为数不多的例子当中,在这些情况下,用户必须要跟广告进行互动才可以。因此,大规模的数据产出的是少量的信号。所以,除非你的数据量中存在着很多有价值的信号,否则数据分析面对再大规模的数据量也无能为力。

4. 你是否需要让数据分析成为自己的核心竞争力?又或者你可以将数据分析这项工作外包出去?

打造一支数据分析团队是困难的,成本也是很高的。如果你能通过「外包」的形式绕过这个问题的话,那自然最好不过。其中的一个选择就是认真地使用顾问。更好的做法是,利用现成的解决方案,比如利用 API 来消化数据,建立模型,将行动自动化,并且在关键指标的评测上给予报告。这些也许不是满足你需求的最完美的解决方案,但是它确实能起到加速你公司发展的效果,让你的核心团队将精力放在能够产出更大价值的领域上。

什么时候你需要将数据分析作为公司的核心竞争力?如果数据分析解决的问题对于你的公司来说具有决定生死输赢的作用,那么你就不能再把它外包出去了。另外,市面上存在的数据分析解决方案往往都比较教条僵化,如果你的公司正在尝试一种创新的方法,比如收集一种全新的数据,又或者以别人想象不到的角度来应用这些数据,那么市面上的这些解决方案的灵活度不够,有可能不太适合你的需求。

◎你什么时候应该开始涉足数据分析?

数据分析要求你从「数据」迈向「分析」,绝大多数的公司一开始并没有多少数据在手里。

谨慎考虑招聘一位数据分析的带头人,又或者是打造一支这样的团队,除非你现在手中有活儿给他们。同时,你要从一开始就收集关键数据,这样在必要的时候,数据分析团队是有分析的基础的。

如果你现在手中还没有数据,那么就应该想想你现在需要收集怎样的数据?什么时候去收集它们?并且将这个工作指派到一个人身上。这个人并不一定非得是数据分析师,但他最好得懂不同数据组合应有的价值,并且在你数据投资的策略上对一些比较棘手的问题做出决策。如果你已经知道你即将要花很多钱和时间在数据获取上,那么也许是时候拨出一点点的预算来,找到你的第一位数据分析师。

有可能出现这样一种情况:你的公司现在正全力以赴地打造数据产品,你现在立刻就需要数据,但是更可能你的最小可行化产品(MVP)将不是数据驱动的。在一开始,最小可行化产品往往凭借的是一种直觉,然后去验证市场是否认可这种直觉?在这种情况下,过早地投资于数据获取和数据分析上面将让你花掉过多的,不必要的时间和金钱,这些资源本应该放在「尽快让你的最小可行化产品上市」这项工作上。

一旦你有了数据(或者很快就要有数据)给数据分析师利用,那么你应该快速地着手准备打造一支数据分析师团队了。

将一种以数据为中心的公司文化建立起来,这项工作的启动应该越早越好。

商业决策,无论是用户获取还是产品发布,都应该建立在数据的基础上,而不是某些人的主观臆断。将数据作为价值的核心所在,让公司全员都能够培养起来这样一种思维习惯,视数据为最高级别的资产,越早做这样一件事,体现出来的价值也就越大。

◎你的数据分析团队归属于公司的哪个部门呢?

你公司的哪个部门能放置数据分析团队,这一点非常重要,这对于其他职能部门的影响,对你整体商业进度的影响会非常明显。通常是三个做法:一支独立运作的团队,一种嵌入式模式,一种双方整合的模式。每一种做法都有利有弊,让我们逐一分析:

独立团队

在独立团队模式下,你的数据分析团队跟工程团队是平行的。数据分析团队的领导者非常关键,一般向产品和工程团队的领导者报告,甚至直接向 CEO 汇报工作。

独立团队的优势特点就是「完全自治」。数据分析团队可以在他们认为重要的问题上进行攻关。而且,数据分析团队能作为独立团队,这充分说明了公司视数据为最重要的资产,这能够帮助公司吸引世界顶级的人才加入。

独立模式往往更适合于「指向决策的数据分析团队」。

即使数据分析师跟产品团队合作紧密,但他们的独立性能够完成比较特别的工作,比如告诉产品经理他们的产品指标没有达到标准,无法让产品进入到上线日程安排表上。而且,数据分析师可以从多个职能部门中获益良多,一方面知道不同的产品指标之间存在怎样的关联关系,另一方面还能将实验和数据分析工作上所获得的真知灼见分享给公司全员。

「自治」所带来的风险-边缘化

当公司不断壮大发展,产品团队的人数越来越多,他们往往愿意自行其事,即便跟数据分析师合作会让他们获得更大的进步,他们也不太愿意考虑这种合作的可能。产品团队就是不想把自己的工作成果放在某些不受他们控制的事情上,他们更愿意靠自己,甚至他们会聘请自己的「数据分析师」,然后在上面挂一个名称「分析工程师」的头衔。如果产品团队日后拒绝跟独立数据分析团队协作,那么数据分析团队很容易被边缘化,且最终变得没有任何价值。于是,从此刻开始,人才都从你的手中逐渐流失掉了。

在 LinkedIn,早期的数据团队就是一支独立团队,团队的自治特点让他们在 LinkedIn 产品的多个部分作出了极其重要的贡献,从「提升你也许想要结识的人的精准性」到「测试作假账户」。但是随着 LinkedIn 的团队不断壮大,它逐渐越来越难以成为独立团队,有效地跟产品团队展开协作了,尤其是产品团队他们自己也雇佣了一些工程师,这些工程师拥有的技能跟数据分析师有些类似。最终,LinkedIn 决定不再需要一支独立运作的数据分析团队了。这个转变计划成为「独立运作」模式的范本。

「嵌入式」的优点

在「嵌入式模式」之下,数据分析团队负责将最有才干的人招募进来,并将他们分配到公司其他部门中。这里仍然存在数据分析领导人,但是他所做的大部分工作都是在招聘跟数据分析有关的经理或者教练。

「嵌入式模式」是「独立团队模式」的反面。它为了方便行事,完全放弃掉了自治的优势。在理想状况下,数据分析师加入到产品团队中,而产品团队恰恰最需要他们的服务。公司上下各个层面所遭遇到的各种问题都能被数据分析师很好的解决掉。

「嵌入式」的缺点是:不是每一个数据分析师都愿意放弃到自治的权力。数据分析师这个岗位描述就是强调创意和主动性,而「嵌入式角色」往往需要让他们听命于某个团队的领导人。

这就带来了一种风险:数据分析师会觉得自己在公司里像是「二等公民」,产品团队的带头人不太会为他们的个人发展,职场满意度做更多的考虑,而数据分析团队的领导人忙着招聘,不直接介入到他们的工作当中。

一句话,在这种模式下,数据分析师是处于一种爹不亲,娘不爱的状态。

我们也看到一些公司采取了「嵌入式」的做法,但是这种模式往往更适合于你已经拥有了一个规模更大的数据分析团队。在 LinkedIn,Daniel 体验到了「嵌入式模式」的好处以及坏处。

实际上,在指向「决策」的数据分析领域,「嵌入式」模式这种方式能更长时间符合公司的发展需求。致力于提升决策的数据分析师能够保证产品团队做决策的质量,尤其是产品发布上线时的决策质量,当然这一切都是从数据而来。同时,集中化的公司组织能够更快地促进信息共享,以及数据分析师的职业发展。但是,跟之前独立模式下的问题一下,当团队的人数增加,嵌入式的模式也不再适合公司发展的需要。最终,LinkedIn 决定将「指向产品的数据分析」整合到了工程团队部门,Daniel 本人也走向了工程岗位,来领导一支既有产品研发又有数据分析的综合性团队,这个团队的任务就是提升搜索质量,而要完成这个工作,工程技术和数据分析人员必须紧密协作才能完成。

全面的整合模式

在整合模式下,这里面不存在单独的数据分析师或者独立运作的数据分析团队。相反,产品团队自己招聘和管理他们自己的数据分析员。

这最大程度地优化了公司部门的人员配置,让数据分析师成为产品团队中不可或缺的一员,它解决了「独立模式」和「嵌入式模式」的缺点。从某种程度上来说,数据分析师、软件工程师、设计师以及产品经理在共同的产品目标下协作。曾经,职能明确的部门往往各自在自己的领域中工作,目标无法达到统一协调,最后产品达不到交付条件,相互推诿扯皮。而如今这个问题也就解决了。

「整合模式」下的缺点是淡化了数据分析的重要性。

每一个数据分析员其实都是归于他所对应的产品团队,而不是一个明显的数据分析师团队。你牺牲了一些「嵌入式」所拥有的灵活性,因为一旦数据分析员按照他们的技能与兴趣,分别归属于不同的部门,他们就很难再调动了。最后,「整合模式」往往就不利于数据分析员的职业发展。而整合团队的领导人往往无法正确意识到数据分析员所做出的成绩,也就无法进一步给予他们奖励。

在 Instacart 公司,数据分析是完全整合于产品团队中的。这些团队都有专门的产品开发领域,有可能是订单实时处理引擎,又或者是购物者在挑选货物时所选取的应用程序,要么就是搜索和推荐服务团队。(一共有 15 支这样的团队)

每一个团队中既有工程师、数据分析员、也有设计师、产品经理。工程师和数据分析员一起向技术负责人汇报工作,这个负责人有可能是工程师,也有可能是数据分析员。整个团队结构保证了工程师和数据分析员能够紧密协作,同时他们也能获得最大的授权,尽一切所能去完成团队的目标。

正如上面所说,三种模式中每一种都各自有着缺点和优点,你必须搞清楚哪一种模式最适合你的公司,并且在公司发展的过程中,这个模式将如何进行调整。请做好准备,一旦公司的发展阶段不一样了,请及时做出改变。在有些时候,最好的模式往往不是上面三种模式中的某一个,而是混杂了其中两种模式特点。正如 Andy Grove 在「高产出管理」这本书里写的那样:

好的管理是能够兼顾「集中化管理」和「授权化管理」两种模式,这是一种平衡的艺术,既能充分调动起员工们的积极性,又能让自己把握整个公司的战略走向。

◎如何创造一种数据分析在其中能蓬勃发展的公司文化?

当你的公司不断壮大,雄心壮志开始不断增长,不可避免地想要更多的数据分析员。在公司成立早期就打造出适合数据学发展的环境,一旦种子种下来了,随着时间的推移,你所能享受到的红利会越来越多的。

一些公司对外宣称自己是数据驱动,他们确实收集很多数据,并且把钱投在了数据工程领域,持续不断的借助于信息丰富的数据表盘,但是最后他们都功亏一篑。行胜于言。数据分析学只有体现建立在数据基础的决策上才能发挥出价值。

公司必须构建起对数据的信任,哪怕自己从数据而来的判断和决策违反大众的尝试,又或者在公司内部带来非常明显的格局变化。这恰恰是数据能够发挥最大价值的地方。

数据分析师,正如公司里每一个人一样,都想要自己的工作能够被认可,能够给公司的发展带来实实在在的推动作用。如果能让他感受到这一点,那么就会出现一个良性循环,数据分析师一直有动力去解决比较棘手的问题,并且保证自己的解决方案是可以被评估衡量的。

能够正确地识别出来数据分析师所做出的贡献,这一点其实是很困难的。尤其如果他们是被放置在第三种模式「整合团队」之中。你的数据分析领导人必须保证时刻技术都走在别人前面,并且持续不断地发挥作用。公司的高管应该重视数据分析师的作用,将这种态度落实在每天的日常工作中。

他们必须跟产品经理、工程师、设计师保持紧密地协作,否则他们就拿不出来让人们赞叹的工作成果,公司领导者和运营管理人员也必须重视他们的意见,否则他们就成了摆设。Jeremy 作为数据分析领导人加入 Sailthru 的时候,工程团队对数据分析扔是持有半信半疑的看法。为了让每个人能够相信它,Jeremy 入职的前两个月专门在公司内部开设了一门课程,让技术工程人员在数据分析这个领域有更加全面、深刻的认识。

在这堂课中,所采取的例子全部来自于 Sailthru 的数据,并且让工程师能够参与到「面向产品的数据分析」工作中来,这堂课大大促进了公司对数据学的理解。当然,所做的最大投入还是时间上的。尤其是在前面几个月。但是能够让工程师真的对数据分析产生兴趣,产生信任,上面的付出算是值得的。

尽管挂着「数据分析」这四个字,但是这门学科从某个角度上是艺术。不是所有的东西都能被测量,我们都受限于手头上的算法,计算机性能,甚至里面还存在一些人为作假的可能。

在未来,数据分析团队所发挥的作用将会更大,如果你能够在公司内部打造出一支多元化的团队来的话。所谓多元化,是队伍的技能组合、世界观、从业背景完全不同。

最后,招聘数据分析师的时候,首先考虑那些能够体现出你公司价值观的应聘者。这些数据分析师必须获得团队、用户、决策者的信任。当你在打造一支团队的时候,对于那些拥有职业操守,正直可信的员工要给予奖励,他们会让公司的价值观进一步发扬光大。他们的手中握着你想象不到的力量,公司的未来会被这股力量所塑造。



数据分析咨询请扫描二维码

客服在线
立即咨询