京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在上一篇文章(python在手,女神视频轻松有)分享了用AI人脸识别技术标记人物出现时间点来截取视频片段的教程,它的局限性在于只能通过识别特定的对象(比如人脸)来操作。在本文中将分享一个按场景进行分割视频的工具——PySceneDetect。
下面开始介绍下PySceneDetect及其安装使用方法。
PySceneDetect是一个命令行工具和Python库,用于分析视频,查找场景更改或剪辑。
PySceneDetect集成了外部工具(例如mkvmerge , ffmpeg ),可在使用split-video命令时自动将视频分割为单个片段。还可以为视频生成逐帧分析,称为统计文件,以帮助确定最佳阈值或检测特定视频的模式/其他分析方法。
PySceneDetect使用两种主要的检测方法:detect-threshold (将每个帧与设置的黑电平进行比较,对于检测从黑色到黑色的淡入和淡出有用)和detect-content (比较每个帧,依次查找内容的变化,有用)用于检测视频场景之间的快速切换,尽管处理速度较慢)。每种模式的参数略有不同,并在文档中进行了详细说明.。
通常,如果要使用淡入/淡出/切成黑色来检测场景边界,请使用检测阈值模式。如果视频在内容之间使用大量快速剪切,并且没有明确定义的场景边界,则应使用" 检测内容"模式。一旦知道要使用哪种检测模式,就可以尝试以下建议的参数,或生成统计文件(使用-s / –stats参数),以确定正确的参数-具体来说,是正确的阈值.
PySceneDetect依赖于Python模块numpy,OpenCV(cv2模块)和tqdm(进度条模块,用来显示处理进度),安装命令如下:
$ pip install scenedetect
PySceneDetect基于ffmpeg和mkvmerge对视频进行裁剪。
ffmpeg 是一个开源软件,可以运行音频和视频多种格式的录影、转换、流功能,它功能强大,用途广泛,是视频处理最常用的开源软件。
mkvmerge是MKV工具集MKVToolNix中的一个软件,可以将多媒体文件封装、合并、混流为 MKV 文件。
安装完成后可以通过命令行或代码两种方式进行使用。
PySceneDetect在命令行中使用scenedetect命令进行操作,命令格式如下:
$ scenedetect --input my_video.mp4 --output my_video_scenes --stats my_video.stats.csv detect-content list-scenes save-images
参数说明:
常用的参数说明如下:
完整的参数列表可使用scenedetect help all命令进行查看。
示例:
$ scenedetect --input demo.mp4 detect-content list-scenes save-images split-video
运行完成后会在当前文件夹生成视频片段,片段截图以及csv文件,如下:
demo-Scene-001-01.jpg demo-Scene-004-03.jpg ... demo-Scene-001-02.jpg demo-Scene-004.mp4 ... demo-Scenes.csv
csv文件中包含片段的帧、时间、长度等信息,内容如下:
Timecode List: 00:07.9 00:14.6 00:38.7 00:45.3 00:48.9 01:00.0 01:12.3 01:21.5 01:36.3 Scene Number Start Frame Start Timecode Start Time (seconds) End Frame End Timecode End Time (seconds) Length (frames) Length (timecode) Length (seconds) 1 0 00:00.0 0 190 00:07.9 7.917 190 00:07.9 7.917 2 190 00:07.9 7.917 350 00:14.6 14.583 160 00:06.7 6.667 3 350 00:14.6 14.583 928 00:38.7 38.667 578 00:24.1 24.083 ...
在Python中使用PySceneDetect主要用到下面几个类:
官方的示例代码如下:
from __future__ import print_function
import os
import scenedetect
from scenedetect.video_manager import VideoManager
from scenedetect.scene_manager import SceneManager
from scenedetect.frame_timecode import FrameTimecode
from scenedetect.stats_manager import StatsManager
from scenedetect.detectors import ContentDetector
STATS_FILE_PATH = 'testvideo.stats.csv'
def main():
# Create a video_manager point to video file testvideo.mp4. Note that multiple
# videos can be appended by simply specifying more file paths in the list
# passed to the VideoManager constructor. Note that appending multiple videos
# requires that they all have the same frame size, and optionally, framerate.
video_manager = VideoManager(['testvideo.mp4'])
stats_manager = StatsManager()
scene_manager = SceneManager(stats_manager)
# Add ContentDetector algorithm (constructor takes detector options like threshold).
scene_manager.add_detector(ContentDetector())
base_timecode = video_manager.get_base_timecode()
try:
# If stats file exists, load it.
if os.path.exists(STATS_FILE_PATH):
# Read stats from CSV file opened in read mode:
with open(STATS_FILE_PATH, 'r') as stats_file:
stats_manager.load_from_csv(stats_file, base_timecode)
start_time = base_timecode + 20 # 00:00:00.667
end_time = base_timecode + 20.0 # 00:00:20.000
# Set video_manager duration to read frames from 00:00:00 to 00:00:20.
video_manager.set_duration(start_time=start_time, end_time=end_time)
# Set downscale factor to improve processing speed.
video_manager.set_downscale_factor()
# Start video_manager.
video_manager.start()
# Perform scene detection on video_manager.
scene_manager.detect_scenes(frame_source=video_manager)
# Obtain list of detected scenes.
scene_list = scene_manager.get_scene_list(base_timecode)
# Like FrameTimecodes, each scene in the scene_list can be sorted if the
# list of scenes becomes unsorted.
print('List of scenes obtained:')
for i, scene in enumerate(scene_list):
print(' Scene %2d: Start %s / Frame %d, End %s / Frame %d' % (
i+1,
scene[0].get_timecode(), scene[0].get_frames(),
scene[1].get_timecode(), scene[1].get_frames(),))
# We only write to the stats file if a save is required:
if stats_manager.is_save_required():
with open(STATS_FILE_PATH, 'w') as stats_file:
stats_manager.save_to_csv(stats_file, base_timecode)
finally:
video_manager.release()
if __name__ == "__main__":
main()
代码地址
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25