
在上一篇文章(python在手,女神视频轻松有)分享了用AI人脸识别技术标记人物出现时间点来截取视频片段的教程,它的局限性在于只能通过识别特定的对象(比如人脸)来操作。在本文中将分享一个按场景进行分割视频的工具——PySceneDetect。
下面开始介绍下PySceneDetect及其安装使用方法。
PySceneDetect是一个命令行工具和Python库,用于分析视频,查找场景更改或剪辑。
PySceneDetect集成了外部工具(例如mkvmerge , ffmpeg ),可在使用split-video命令时自动将视频分割为单个片段。还可以为视频生成逐帧分析,称为统计文件,以帮助确定最佳阈值或检测特定视频的模式/其他分析方法。
PySceneDetect使用两种主要的检测方法:detect-threshold (将每个帧与设置的黑电平进行比较,对于检测从黑色到黑色的淡入和淡出有用)和detect-content (比较每个帧,依次查找内容的变化,有用)用于检测视频场景之间的快速切换,尽管处理速度较慢)。每种模式的参数略有不同,并在文档中进行了详细说明.。
通常,如果要使用淡入/淡出/切成黑色来检测场景边界,请使用检测阈值模式。如果视频在内容之间使用大量快速剪切,并且没有明确定义的场景边界,则应使用" 检测内容"模式。一旦知道要使用哪种检测模式,就可以尝试以下建议的参数,或生成统计文件(使用-s / –stats参数),以确定正确的参数-具体来说,是正确的阈值.
PySceneDetect依赖于Python模块numpy,OpenCV(cv2模块)和tqdm(进度条模块,用来显示处理进度),安装命令如下:
$ pip install scenedetect
PySceneDetect基于ffmpeg和mkvmerge对视频进行裁剪。
ffmpeg 是一个开源软件,可以运行音频和视频多种格式的录影、转换、流功能,它功能强大,用途广泛,是视频处理最常用的开源软件。
mkvmerge是MKV工具集MKVToolNix中的一个软件,可以将多媒体文件封装、合并、混流为 MKV 文件。
安装完成后可以通过命令行或代码两种方式进行使用。
PySceneDetect在命令行中使用scenedetect命令进行操作,命令格式如下:
$ scenedetect --input my_video.mp4 --output my_video_scenes --stats my_video.stats.csv detect-content list-scenes save-images
参数说明:
常用的参数说明如下:
完整的参数列表可使用scenedetect help all命令进行查看。
示例:
$ scenedetect --input demo.mp4 detect-content list-scenes save-images split-video
运行完成后会在当前文件夹生成视频片段,片段截图以及csv文件,如下:
demo-Scene-001-01.jpg demo-Scene-004-03.jpg ... demo-Scene-001-02.jpg demo-Scene-004.mp4 ... demo-Scenes.csv
csv文件中包含片段的帧、时间、长度等信息,内容如下:
Timecode List: 00:07.9 00:14.6 00:38.7 00:45.3 00:48.9 01:00.0 01:12.3 01:21.5 01:36.3 Scene Number Start Frame Start Timecode Start Time (seconds) End Frame End Timecode End Time (seconds) Length (frames) Length (timecode) Length (seconds) 1 0 00:00.0 0 190 00:07.9 7.917 190 00:07.9 7.917 2 190 00:07.9 7.917 350 00:14.6 14.583 160 00:06.7 6.667 3 350 00:14.6 14.583 928 00:38.7 38.667 578 00:24.1 24.083 ...
在Python中使用PySceneDetect主要用到下面几个类:
官方的示例代码如下:
from __future__ import print_function import os import scenedetect from scenedetect.video_manager import VideoManager from scenedetect.scene_manager import SceneManager from scenedetect.frame_timecode import FrameTimecode from scenedetect.stats_manager import StatsManager from scenedetect.detectors import ContentDetector STATS_FILE_PATH = 'testvideo.stats.csv' def main(): # Create a video_manager point to video file testvideo.mp4. Note that multiple # videos can be appended by simply specifying more file paths in the list # passed to the VideoManager constructor. Note that appending multiple videos # requires that they all have the same frame size, and optionally, framerate. video_manager = VideoManager(['testvideo.mp4']) stats_manager = StatsManager() scene_manager = SceneManager(stats_manager) # Add ContentDetector algorithm (constructor takes detector options like threshold). scene_manager.add_detector(ContentDetector()) base_timecode = video_manager.get_base_timecode() try: # If stats file exists, load it. if os.path.exists(STATS_FILE_PATH): # Read stats from CSV file opened in read mode: with open(STATS_FILE_PATH, 'r') as stats_file: stats_manager.load_from_csv(stats_file, base_timecode) start_time = base_timecode + 20 # 00:00:00.667 end_time = base_timecode + 20.0 # 00:00:20.000 # Set video_manager duration to read frames from 00:00:00 to 00:00:20. video_manager.set_duration(start_time=start_time, end_time=end_time) # Set downscale factor to improve processing speed. video_manager.set_downscale_factor() # Start video_manager. video_manager.start() # Perform scene detection on video_manager. scene_manager.detect_scenes(frame_source=video_manager) # Obtain list of detected scenes. scene_list = scene_manager.get_scene_list(base_timecode) # Like FrameTimecodes, each scene in the scene_list can be sorted if the # list of scenes becomes unsorted. print('List of scenes obtained:') for i, scene in enumerate(scene_list): print(' Scene %2d: Start %s / Frame %d, End %s / Frame %d' % ( i+1, scene[0].get_timecode(), scene[0].get_frames(), scene[1].get_timecode(), scene[1].get_frames(),)) # We only write to the stats file if a save is required: if stats_manager.is_save_required(): with open(STATS_FILE_PATH, 'w') as stats_file: stats_manager.save_to_csv(stats_file, base_timecode) finally: video_manager.release() if __name__ == "__main__": main()
代码地址
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25