京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA数据分析师 出品
作者:Mika
数据:真达
后期:Mika
【导读】
Show me data,用数据说话
今天我们聊一聊 《演员请就位2》,最近开播的国综里面,热度最高的一定是《演员请就位》了。从第一季起这部综艺就话题不断,金句频出,前有李诚儒老师的“如坐针毡,如芒刺背,如鲠在喉”;这一季,李诚儒老师再出金句,“味同嚼蜡,味如鸡肋,如此乏味”一度刷爆网络。
《演员请就位2》导师方面,除了上一季的陈凯歌、赵薇、郭敬明,还有这季加入的尔冬升导演,阵容上就十分有看点。参加的演员方面也有胡杏儿、黄奕、娄艺潇等熟悉的身影。
《演员2》一开播就热搜话题不断,无论是李诚儒老师、尔冬升导演的犀利点评,郭敬明给演技小白何昶希发S卡都能引起大量的讨论。
我们今天就用Python分析了《演员2》的视频弹幕,看看大家都在吐槽些什么。
01、豆瓣6.5分 《演员2》为啥差强人意?
《演员请就位》目前为止已经播出了两季,第一季在豆瓣为6.8分,共有4万余人评分。
而目前正在播出的第二季,已有1万9千多人评分,分数为6.5分,比上一季还低了0.3分。
分数占比
我们用Python分析了豆瓣的500条热评数据,从评分分布可以看到:
分数占比方面,37%的人给出1星,20.8%的人给出2星。给出5星好评的仅有5%。
豆瓣短评
那么短评中都在说些什么呢?
从评价词云图中可见,话题主要集中在郭敬明、尔冬升、陈凯歌、李诚儒几位嘉宾上。这也是《演员2》被诟病的一点,嘉宾导师比参赛的演员更出圈,更有话题。此外,"节目"、"演技"、"点评"等也是短评中常出现的。
导演提及
几位嘉宾导师中,谁被提到的次数最多呢?
进一步分析可见,郭敬明占据着最高的话题度,其次是尔冬升和陈凯歌。
导演评价
在对导演和主持嘉宾的评价也十分有意思,对郭敬明的差评达到60.66%,超过的半数,好评仅为14.22%。这与尔冬升的评价差距很大,后者的差评仅为28.83%,好评度也是最高的,达到了29.73%。而有趣的是,作为主持人的大鹏差评度居然比郭敬明还高,达到了67.27%。
02、分析45万条弹幕数据,看看大家都在吐槽什么
我们使用Python获取并分析了《演员请就位2》的腾讯弹幕数据,分析了目前播放的前五期。
1.1 数据读入
首先导入所需库。
# 导入库 import os import jieba import numpy as np import pandas as pd from pyecharts.charts import Bar, Pie, Line, WordCloud, Page from pyecharts import options as opts from pyecharts.globals import SymbolType, WarningType WarningType.ShowWarning = False import stylecloud from IPython.display import Image # 用于在jupyter lab中显示本地图
使用pandas循环读取数据。
# 读入数据 data_list = os.listdir('../data/') df_all = pd.DataFrame() for i in data_list: # print(i) df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0) df_all = df_all.append(df_one, ignore_index=False) df_all.info()
<class 'pandas.core.frame.DataFrame'> Int64Index: 449762 entries, 0 to 44317 Data columns (total 7 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 episodes 449762 non-null object 1 comment_id 449762 non-null int64 2 oper_name 183066 non-null object 3 vip_degree 449762 non-null int64 4 content 449762 non-null object 5 time_point 449762 non-null int64 6 up_count 449762 non-null int64 dtypes: int64(4), object(3) memory usage: 27.5+ MB
共获取了前五期449762条弹幕数据。字段主要包括:期数、评论id、用户名、vip等级、评论内容、评论时间点和点赞数,数据预览如下:
df_all.head()
1.2 数据预处理
# 删除弹幕角色 df_all['content'] = df_all['content'].str.replace('(.*?:)', '') df_all.head()
1.3 数据可视化
弹幕走势图
先看到视频弹幕走势图,从数量上可以看到,弹幕数量前三的分别是:第一期上、第三期上、第五期上。而第一期下和第五期下的弹幕较少。
df_epinum = df_all['episodes'].value_counts().reset_index()
df_epinum['num'] = [1, 5, 3, 7, 6, 8, 4, 9, 2, 10]
df_epinum = df_epinum.sort_values('num')
df_epinum
x_data = df_epinum['index'].tolist()
y_data = df_epinum['episodes'].tolist()
# 条形图
bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(xaxis_data=x_data)
bar1.add_yaxis('', y_axis=y_data)
bar1.set_global_opts(title_opts=opts.TitleOpts(title='前五期的弹幕数走势图'),
visualmap_opts=opts.VisualMapOpts(max_=60000, is_show=False) ) bar1.render()
人物弹幕词云
我们接着再分别看到几位导演导师的弹幕词云。
——热门课程推荐:
想学习PYTHON数据分析与金融数字化转型精英训练营,您可以点击>>>“人才转型”了解课程详情;
想从事业务型数据分析师,您可以点击>>>“数据分析师”了解课程详情;
想从事大数据分析师,您可以点击>>>“大数据就业”了解课程详情;
想成为人工智能工程师,您可以点击>>>“人工智能就业”了解课程详情;
想了解Python数据分析,您可以点击>>>“Python数据分析师”了解课程详情;
想咨询互联网运营,你可以点击>>>“互联网运营就业班”了解课程详情;
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多 ...
2026-05-14 很多人把统计学理解为“一堆公式和计算”,却忽略了它的本质——一门让数据“开口说话”的科学。真正的数据分析高手,不是会 ...
2026-05-14在零售行业存量竞争日趋激烈的当下,客户流失已成为侵蚀企业利润的“隐形杀手”——据行业数据显示,零售企业平均客户流失率高达 ...
2026-05-13当流量红利消退、用户需求日趋多元,“凭经验决策、广撒网投放”的传统营销模式早已难以为继。大数据的崛起,为企业营销提供了全 ...
2026-05-13 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-05-13在手游行业存量竞争日趋激烈、流量成本持续高企的当下,“拉新”早已不是行业核心痛点,“留存”尤其是“付费留存”,成为决定手 ...
2026-05-12 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-05-12用户调研是企业洞察客户需求、优化产品服务、制定运营策略的核心前提,而调研数据的可靠性,直接决定了决策的科学性与有效性。在 ...
2026-05-11在市场竞争日趋激烈、流量成本持续攀升的今天,企业的核心竞争力已从“获取流量”转向“挖掘客户价值”。客户作为企业最宝贵的资 ...
2026-05-11 很多数据分析师精通Excel单元格操作,熟练应用多种公式,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质 ...
2026-05-11在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09