
透过日播放量超过6亿的《延禧攻略》,看2018年视频网站格局
随着《延禧攻略》的播出,魏璎珞、富察皇后等各位后宫小主的命运时刻牵动着各位观众的心。同时爱奇艺也因为该剧的大火,收获了单日超过6亿的播放量。我们此次将对比各大视频网站2018年截止到8月18号的电视剧和综艺节目的播放情况,大家可以据此选择购买会员的视频网站(壕er可以无视,直接购买所有会员)。
01
数据来源
猫眼APP提供了每日各大视频网站的播放量,截图如下:
我们通过Fiddler分析得到数据接口地址, 以优酷网8月11号电视剧播放量为例: http://maoyan.com/proseries/api/seriesTopRank.json?platformType=1&seriesType=0&dateRange=0&date=2018-08-11
其中platformType=1表示平台为优酷,SeriesType=0表示类型为电视剧,dateRange=0表示为数据日榜,最后的date则为具体日期,代码如下:
play_data=pd.DataFrame(columns=['date','name','play_num','type','platform','monopoly'])
foriinrange(0,3):
forjinrange(0,7):
fordateinpd.date_range('2018-01-01','2018-08-18',freq='D'):
try:
time.sleep(0.5)
url='http://box.maoyan.com/proseries/api/seriesTopRank.json?platformType='+str(j)+'&seriesType='+str(i)+'&dateRange=0&date='+str(date)[0:10]
html=requests.get(url=url,cookies=cookie,headers=header).content
data=json.loads(html.decode('utf-8'))['data']['seriesDailyRankList']
foritemindata:
play_data=play_data.append({'date':str(date)[0:10],
'name':item['name'],
'play_num':float(item['playCountDesc']),
'type':i,
'platform':j,
'monopoly':item['platformInfoDescV2']},
ignore_index=True)
print(str(i)+''+str(j)+''+str(date)[0:10])
except:
02
整体播放量
通过猫眼接口我们可以获得各大视频网站每天TOP30电视剧、TOP30网剧(我们统一为电视剧)和TOP30综艺节目的日播放量,以此对比视频网站2018整体的播放量,我们用R语言的ggplot完成数据可视化的部分:
可以看到在猫眼提供的七个视频网站中,搜狐、乐视、PP视频占比非常小。我们在后面的内容中将重点对比腾讯、优酷、爱奇艺和芒果四大视频网站。首先看一下整体播放量:
下面看一下剧集和综艺分别的播放量:
可以看到无论是剧集还是综艺,2018年迄今为止腾讯视频都处于领先地位。芒果视频在剧集的播放量相较于其他网站,播放量偏低,但在综艺方面已经超过了优酷,与爱奇艺基本持平。
03
月度播放量
在前言中我们提到了《延禧攻略》最近大火,我们通过月度数据看一下其近期是否带动了爱奇艺整体的电视剧播放量份额:
可以看到在1-7月电视剧播放量一直落后于腾讯,大部分时间落后优酷的爱奇艺在8月通过《延禧攻略》的播出实现了反超,由于同类型的《如懿传》已经定档在腾讯播出,爱奇艺能否继续保持优势也值得期待。
我们同时看一下综艺的月度数据:
腾讯从4月份开始,随着《创造101》等节目的播出,在综艺节目的播放量上遥遥领先于其他的视频网站,下半年能够延续该势头与其能否继续找到有爆点的节目息息相关。
04
独播数据
独播视频一直以来都是视频网站最为重要的资源,我们首先看一下整体独播占比随月度变化情况:
综艺节目的独播占比要高于电视剧,这与视频网站大力投入到自制节目有关,也使得喜爱综艺节目的用户对于网站会员的需求变大。同时可以看到6月以来的独播占比开始持续增加,都已经超过50%,这或许也将成为未来视频网站的一大趋势。
下面看一下各大网站分别的独播占比情况:
各大网站6月以来的独播占比都在显著提高,优酷的综艺节目独播占比基本上超过了9成。芒果随着新版《流星花园》的播出,独播占比也在快速提升,未来可能也会在电视剧播放量占到更高份额。
05
剧集对比
首先我们看一下平均日播放量(我们选取每个电视剧最高的五天进行评价)TOP25的对比及网站分布
《延禧攻略》在爱奇艺单个平台的单日平均播放量已经超过了除《恋爱先生》和《谈判官》外所有多平台播放的电视剧,并且与上述两部多平台总体剧集也十分接近。我们也更加深刻地理解了选取剧集对于视频网站的整体影响。
我们同时选出所有的独播剧集,对比独播剧集TOP25:
从数量上对比,优酷和腾讯处于明显的领先地位,并且都有爆款电视剧。而爱奇艺的《延禧攻略》和芒果的《流星花园》排名靠前,也相应提高了其在电视剧播放量上的份额,或许这也会促使这两个网站加大独播剧集的占比。
最后看一下综艺的情况:
显然腾讯在综艺节目方面处于明显的领先地位,无论是整体播放量还是独播资源播放量和数量都领先于其他的竞争对手。整体的发展趋势未来或许会促使更多的《创造101》诞生。
由于可视化代码比较多,而且重复性比较强,我们选取其中的独播剧集绘制部分语句来进行展示:
##绘制TOP25独播剧集数据drama_agg_mon<-ddply(drama_stat_mon,.(name,monopoly,type),summarise,
total_play=sum(play_num))
drama_agg_mon<-drama_agg_mon[order(drama_agg_mon$total_play,decreasing=T),][1:25,]
drama_agg_mon$rank<-1:25
drama_top_mon<-merge(drama_stat_mon,drama_agg_mon,all.x=FALSE,all.y=TRUE,by=c('name'))
ggplot(drama_top_mon,aes(x=reorder(name,-rank),y=play_num,fill=platform))+
geom_bar(stat='identity',position='stack')+ggtitle('TOP25独播电视剧平均日播放量(亿)')+
theme_wsj()+coord_flip()+
scale_fill_wsj()+
theme(legend.position='top',
legend.title=element_blank(),
legend.text=element_text(size=25),
panel.grid=element_blank(),
axis.text.x=element_text(size=15),
axis.text.y=element_text(size=20),
strip.text.x=element_text(size=20),
strip.text.y=element_text(size=20,angle=0),
plot.title=element_text(size=25,hjust=0.5))
- The End -
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30