京公网安备 11010802034615号
经营许可证编号:京B2-20210330
分析了2.2W条抖音数据,发现95后其实很养生
或许是因为抖音的推荐算法,那些火爆的视频会优先推荐给我们,导致其更加火,而那些普通的几百赞视频,则默默的扎堆在一起,被系统遗弃。
文 / 张佳
来源 / 喜新(ID:noyanjiu)
通过一些特殊渠道,本文作者拿到了2月26日-3月27日抖音的2.2W条视频数据,清洗梳理后得到一些好玩的结论,你们或许会喜欢:
1.抖音的核心用户群体“95后”们也很养生,0点以后基本都睡了。
2.毕竟年轻人,情感表达意愿很强烈,“喜欢”是最爱用的词。
3.11:00-22:00是发布视频高峰时段,上午都在睡觉么?
4.晚上9点不要发视频,你会失望的。
1
毕竟年轻人,爱表达自己
更爱表达喜欢
对2.2W条数据的视频描述做分词词频统计,排除了类似“一个”、“这样”、“怎么”等无效词后,得到下面的词云图:
“喜欢”一词累计出现246次,出现频率最高,可见抖音上的年轻人完全不吝啬自己的情感表达;
“自己”一词出现了222次,出现频率第二,看来95后小朋友们非常“喜欢”“自己”;
“真的”和“可以”分别出现了203和202次,大家肯定想到了“抖音爸爸没有骗我,XXX真的可以怎样怎样”的视频。
不得不承认,抖音的带货能力很强!
“教程”出现了143次,“发型”出现了91次,“思域”出现91次,“化妆”出现了83次,“西安”出现72次,“北极星”出现68次……
所以大家应该知道发什么能火了吧?
2
95后年轻人也没那么熬
中毒的应该都是“中年人”
把视频的发布时间以小时为单位统计,发现这么个规律:
抖音主要用户的作息都比较规律,视频发布集中在上午10:00至晚上00:00,0点以后视频发布数量很明显的出现下降。
小哥哥小姐姐们都睡了,这帮中年人还在那里“中毒”。(2点以后那些视频是不是你们发的?)
3
黄金时段不黄金
不要在九点发视频
结合上面的视频发布时间数据,我们把视频的点赞数据加上,统计每个小时的点赞总和,得到下面这么一个图:
为了方便比较,我把平均点赞数也加入到图中(红色线条),我们可以很清楚地看到:
下午13:00和晚上18:00是点赞的高峰,平均点赞量除了早5:00因为陈赫发布了一条视频造成明显差异外,上午10:00和11:00,晚上20:00和21:00四个时间点的点赞数据与视频发布数量明显不成比例;
尤其是晚上21:00,是整个下午和晚上时间段中的最低点,好好的黄金时段,怎么就“黄”了呢?
此外,图表也很清楚的告诉我们,中午饭后(13:00)和下班时间(18:00)是粉丝们最爱点赞的时刻。
所以各位想火的小伙伴,别在晚上9点发视频是明智的选择。
4
强者越强,弱者扎堆
每天刷抖音,看到的几乎都是几千上万赞视频,让我们觉得每一条抖音都能火。
其实则不然,统计2.2W条数据的点赞数,得到下面这么一个曲线图:
在这2.2W条数据里,像我们看到的那些上万赞的视频其实很少,绝大部分的视频点赞都在700以下。
或许是因为抖音的推荐算法,那些火爆的视频会优先推荐给我们,导致其更加火,而那些普通的几百赞视频,则默默的扎堆在一起,被系统遗弃。
5
平均100次播放才能获得一个小心心
被推荐不一定会火
实际上,通过数据我们发现,即便你的视频被系统推荐了,小哥哥小姐姐们也并不一定买账。
用播放数/点赞数,得到比值代表了多少次播放可以获得一次点赞。
通过上面的数据我们发现,播放点赞比主要集中在20-150之间,也就是说大部分视频需要被推荐给100个人观看后才能获得一个小心心。
当然也有苦逼的,作者“挽风”的一条视频,被播放4万次,但是只收获了,emmmm,4个赞……
6
抖音的粉丝很忠诚
女明星看了会哭泣
统计播放量大于1万,播放评论比(和播放点赞比类似)小于50的视频描述词频,我们发现明星相关的视频容易引发评论,主要是女明星……
热巴、杨颖(Angelbaby)、关晓彤、赵丽颖等女明星们荣登词云图,你们的粉丝很爱你,每50次播放就会为你们评论一次,是不是激动地哭出来了?
当然,会哭的孩子也有奶喝,求“评论”的视频小哥哥和小姐姐们也基本都满足你们了。让“你们”“打出/输入”XXX看看能出来“什么”“答案”的玩法,小哥哥和小姐姐们也很买账。
以上,希望各位小哥哥小姐姐喜欢。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22