京公网安备 11010802034615号
经营许可证编号:京B2-20210330
企业做大数据需要一个关键人_数据分析师
几年前大数据还不是优酷土豆的文化。管理层、各部门员工,知道有数据,但不知道数据有什么用。数据如何提供决策支撑?如何改变工作效率?没有人知道。其实现在很多公司都面临这个问题,数据是独立的,无法融入公司的运营。
目前,优酷土豆集团的视频总时长已经超过8000年,并且以每天新增4年的速度高速增长。
通过对基于这些内容的数据挖掘,{数据分析师培训}优酷土豆集团可以为用户提供“猜你喜欢”的视频推荐;为广告主提供更精准、有价值的投放内容;给公司版权采购部门提供更清晰的采购指导;让产品部门找到自己的优势并推动页面改版。
除此之外,2014年8月,优酷土豆集团还成立了“合一影业”,希望依托于大数据视频行业的“大自制”时代。
“最重要的,是让数据种子在每个人心中生根发芽,不只是大数据团队,还有管理层、各个部门员工。”优酷土豆集团数据分析高级总监杜长嵘在近日接受21世纪经济报道记者采访时表示,两年前,公司管理层不习惯用数据来做决策,各部门同事也不知道怎么利用数据改善工作,但现在数据文化已经深入人心。
“实现用户、内容、
流量的可视化”
《21世纪》:互联网流量中有50%以上都是视频流量。作为视频公司,优酷土豆如何对视频数据做分析挖掘,这些分析又对你们回馈了哪些价值?
杜长嵘:2014年11月,优酷App 用户时长超过手机QQ,在中文APP中排名第二,仅次于微信。可以说用户在视频上支出的时间越来越多,而视频数据的价值也越来越大。
最典型的大数据应用就是“猜你喜欢”,根据用户个人偏好推荐视频。我们会分析你过去的历史,看用户喜欢哪些类型的视频;寻找跟你同一类型的人,把他们的内容推荐给你;甚至,从视频本身的角度,我们也可以知道看这个视频的人还会喜欢其他哪些内容。融合多个分析维度,就产生了“猜你喜欢”这个应用。
我们对页面浏览、评论、收藏、播放时的拖拽操作进行了记录,并且把分析结果反馈给不同的业务模块。这对包括产品、内容运营、用户的个性化推荐及广告投放、管理层决策支撑,都起到了关键作用。
《21世纪》:视频推荐应该算是改变用户体验的一种应用,那么对于你们的广告主、对于公司管理层,大数据能提供什么价值?
杜长嵘:先举个有意思的案例。双11,我们本来觉得这跟视频没关系。但是,从11.1开始,我们流量开始下滑,11.11当天,流量下滑达到10%,非常严重。我们就赶紧去调查数据,发现天猫在我们这里投放了大量广告,很多优土用户看到购物广告的时候就放弃视频,直接去购物了。也就是说,优酷土豆的视频用户,对于购物网站非常有广告价值。
后来,天猫公布数据,双11期间,天猫的流量来源第一名是淘宝,第二名竟然就是优酷,占了他们流量的30%。我们进一步分析发现:80%的天猫用户是优酷的用户,而庞大的优酷用户中,有50%是天猫用户。他们在我们这边投硬广是一个很正确的决策。
除了用户价值之外,视频内容的价值也可以通过数据衡量,每个内容,都有它匹配的用户群、点击量,老板可以根据这些来衡量、标定每个业务的价值。对广告客户来说,他们能更精确找到自己的用户群。
总的来说,是利用数据实现用户、内容、流量的可视化,价值更透明。管理层需要这些数据,执行更精确的决策。
支撑移动端转型
《21世纪》:对于企业内部的业务管理、流程再造方面,有没有一些明显改变?
杜长嵘:其实,当内容、流量都透明了之后,企业的效率自然就会提升。
拿提升用户体验来说,用户打开视频需要经过几个步骤:打开首页、播放页加载、播放器加载、广告加载、视频加载,然后才是观看。观看过程中还会发生拖拽、卡顿、清晰度切换等等操作。我们每一步骤都会实现数据追踪,包括用户每一个加载完成花了多长时间,出错率或者转换率是多少。如果有问题发生,就可以马上定位是哪一个步骤出现了什么问题。而对应到产品部门,大家都能看清楚是谁的岗位出了问题,相对应的部门也会主动解决。
以前这些过程不透明,很难定位问题、责任,现在效率提升了很多。
《21世纪》:优酷土豆的管理层如何看待大数据,如何利用大数据做决策支撑?
杜长嵘:很多公司讲大数据的时候,都把数据当作是一个应用平台,或者说是一个数据报表的平台,但其实管理层需要的不是这些。他们需要知道的是这些数据的内在价值。这也是我们大数据团队要做的事,让数据说话,告诉管理者过去这段时间都发生了什么。然后讨论,这些变化为什么会发生,从数据上能看出哪些未来的趋势。
对管理层来说,既然看到了趋势到来,那么为什么不干脆去创造趋势、引领趋势呢?
比如,2008年,我们就知道移动端是未来,并开始了部署。2012年1月,我们移动端的流量占比是3%;而2013年1月的时候,移动端流量增长了1400%,占比达到30%;2014年1月,同比仍然增长了250%,占比达到60%,超过PC。到2014年11月,占比已经达到了70%。双11期间,移动端给公司贡献的收入超过40%。
向移动端转型很顺利,主要是因为我们早就把相关的工作部署下去了。
从管理者的决策来说,优酷土豆要做的就是引领趋势、创造趋势。而且,由于有庞大的数据分析支撑,我们能够很谨慎的成为先驱者,不会是先烈。
数据文化要融入公司运营
《21世纪》:你在大数据应用中遇到哪些挑战呢?
杜长嵘:如果你两年前问我这个问题,我可能讲整整一个下午都讲不完。但现在来看,当时遇到的问题都不存在了。
总结来看,几年前大数据还不是优酷土豆的文化。管理层、各部门员工,知道有数据,但不知道数据有什么用。数据如何提供决策支撑?如何改变工作效率?没有人知道。其实现在很多公司都面临这个问题,数据是独立的,无法融入公司的运营。
要发挥大数据的价值,必须要让数据的种子在每个人心中生根发芽。我们现在解决了这些挑战,然后所有的问题就自然而然的消失了。
《21世纪》:这些问题具体是如何解决的?
杜长嵘:我觉得企业做大数据需要一个关键的人,他要带动整个公司的化学变化。这个人其实要懂技术、懂业务,甚至要懂管理、懂运营,你要都懂,然后带头去起推动数据效应,才能让整个公司慢慢产生这个变化。
两年前,只要公司的管理层开会,我就厚着脸皮冲过去。我必须要知道领导在关心什么,然后赶快去投其所好,用数据角度不断的帮他介绍。一次不行,我就讲五次,多讲几次就可以了。现在的优土,数据已经是管理思维的一部分。
不过,对各部门员工来说,推荐大数据比较难,因为很多人觉得数据枯燥,找不到数据的价值所在。以前,不少员工来直接找我们要数据,问他为什么要数据,回答“老板要”、“做工作汇报用”。他们不习惯于用这些数据来改善业务、改变工作。
只能一点点让大家对数据产生兴趣。所以只要一有员工培训会,我就去讲课。一开始还只能讲一些比较好玩的数据分析案例,比如我经常讲一个故事,二次大战时,英国、美国通过对弹痕的分析,来加强飞机的抗击打能力,减少飞机战损。
两年多的潜移默化,其实是让每个人都知道数据的价值在哪里。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22