YouTube 视频智能剪辑工具
Installation: If you're installing this skill from GitHub, please refer to README.md for installation instructions. The recommended method is npx skills add https://github.com/op7418/Youtube-clipper-skill.
工作流程
你将按照以下 6 个阶段执行 YouTube 视频剪辑任务:
阶段 1: 环境检测
目标: 确保所有必需工具和依赖都已安装
检测 yt-dlp 是否可用
yt-dlp --version
检测 FFmpeg 版本和 libass 支持
优先检查 ffmpeg-full(macOS)
/opt/homebrew/opt/ffmpeg-full/bin/ffmpeg -version
检查标准 FFmpeg
ffmpeg -version
验证 libass 支持(字幕烧录必需)
ffmpeg -filters 2>&1 | grep subtitles
检测 Python 依赖
python3 -c "import yt_dlp; print('✅ yt-dlp available')" python3 -c "import pysrt; print('✅ pysrt available')"
如果环境检测失败:
yt-dlp 未安装: 提示 brew install yt-dlp 或 pip install yt-dlp FFmpeg 无 libass: 提示安装 ffmpeg-full brew install ffmpeg-full # macOS
Python 依赖缺失: 提示 pip install pysrt python-dotenv
注意:
标准 Homebrew FFmpeg 不包含 libass,无法烧录字幕 ffmpeg-full 路径: /opt/homebrew/opt/ffmpeg-full/bin/ffmpeg (Apple Silicon) 必须先通过环境检测才能继续 阶段 2: 下载视频
目标: 下载 YouTube 视频和英文字幕
询问用户 YouTube URL
调用 download_video.py 脚本
cd ~/.claude/skills/youtube-clipper
python3 scripts/download_video.py
脚本会:
下载视频(最高 1080p,mp4 格式) 下载英文字幕(VTT 格式,自动字幕作为备选) 输出文件路径和视频信息
向用户展示:
视频标题 视频时长 文件大小 下载路径
输出:
视频文件:
目标: 使用 Claude AI 分析字幕内容,生成精细章节(2-5 分钟级别)
调用 analyze_subtitles.py 解析 VTT 字幕
python3 scripts/analyze_subtitles.py
脚本会输出结构化字幕数据:
完整字幕文本(带时间戳) 总时长 字幕条数
你需要执行 AI 分析(这是最关键的步骤):
阅读完整字幕内容 理解内容语义和主题转换点 识别自然的话题切换位置 生成 2-5 分钟粒度的章节(避免半小时粗粒度切分)
为每个章节生成:
标题: 精炼的主题概括(10-20 字) 时间范围: 起始和结束时间(格式: MM:SS 或 HH:MM:SS) 核心摘要: 1-2 句话说明这段讲了什么(50-100 字) 关键词: 3-5 个核心概念词
章节生成原则:
粒度:每个章节 2-5 分钟(避免太短或太长) 完整性:确保所有视频内容都被覆盖,无遗漏 有意义:每个章节是一个相对独立的话题 自然切分:在主题转换点切分,不要机械地按时间切
向用户展示章节列表:
📊 分析完成,生成 X 个章节:
-
[00:00 - 03:15] AGI 不是时间点,是指数曲线 核心: AI 模型能力每 4-12 月翻倍,工程师已用 Claude 写代码 关键词: AGI、指数增长、Claude Code
-
[03:15 - 06:30] 中国在 AI 上的差距 核心: 芯片禁运卡住中国,DeepSeek benchmark 优化不代表实力 关键词: 中国、芯片禁运、DeepSeek
... (所有章节)
✓ 所有内容已覆盖,无遗漏
阶段 4: 用户选择
目标: 让用户选择要剪辑的章节和处理选项
使用 AskUserQuestion 工具让用户选择章节
提供章节编号供用户选择 支持多选(可以选择多个章节)
询问处理选项:
是否生成双语字幕?(英文 + 中文) 是否烧录字幕到视频?(硬字幕) 是否生成总结文案?
确认用户选择并展示处理计划
阶段 5: 剪辑处理(核心执行阶段)
目标: 并行执行多个处理任务
对于每个用户选择的章节,执行以下步骤:
5.1 剪辑视频片段
python3 scripts/clip_video.py
使用 FFmpeg 精确剪辑
保持原始视频质量
输出: <章节标题>_clip.mp4
5.2 提取字幕片段
从完整字幕中过滤出该时间段的字幕
调整时间戳(减去起始时间,从 00:00:00 开始)
转换为 SRT 格式
输出: <章节标题>_original.srt
5.3 翻译字幕(如果用户选择)
python3 scripts/translate_subtitles.py
批量翻译优化: 每批 20 条字幕一起翻译(节省 95% API 调用)
翻译策略:
保持技术术语的准确性
口语化表达(适合短视频)
简洁流畅(避免冗长)
输出: <章节标题>_translated.srt
5.4 生成双语字幕文件(如果用户选择)
合并英文和中文字幕
格式: SRT 双语(每条字幕包含英文和中文)
样式: 英文在上,中文在下
输出: <章节标题>_bilingual.srt
5.5 烧录字幕到视频(如果用户选择)
python3 scripts/burn_subtitles.py
使用 ffmpeg-full(libass 支持)
使用临时目录解决路径空格问题(关键!)
字幕样式:
字体大小: 24
底部边距: 30
颜色: 白色文字 + 黑色描边
输出: <章节标题>_with_subtitles.mp4
5.6 生成总结文案(如果用户选择)
python3 scripts/generate_summary.py
基于章节标题、摘要和关键词 生成适合社交媒体的文案 包含: 标题、核心观点、适合平台(小红书、抖音等) 输出: <章节标题>_summary.md
进度展示:
🎬 开始处理章节 1/3: AGI 不是时间点,是指数曲线
1/6 剪辑视频片段... ✅ 2/6 提取字幕片段... ✅ 3/6 翻译字幕为中文... [=====> ] 50% (26/52) 4/6 生成双语字幕文件... ✅ 5/6 烧录字幕到视频... ✅ 6/6 生成总结文案... ✅
✨ 章节 1 处理完成
阶段 6: 输出结果
目标: 组织输出文件并展示给用户
创建输出目录
./youtube-clips/<日期时间>/
输出目录位于当前工作目录下
组织文件结构:
<章节标题>/ ├── <章节标题>_clip.mp4 # 原始剪辑(无字幕) ├── <章节标题>_with_subtitles.mp4 # 烧录字幕版本 ├── <章节标题>_bilingual.srt # 双语字幕文件 └── <章节标题>_summary.md # 总结文案
向用户展示:
输出目录路径 文件列表(带文件大小) 快速预览命令 ✨ 处理完成!
📁 输出目录: ./youtube-clips/20260121_143022/
文件列表: 🎬 AGI_指数曲线_双语硬字幕.mp4 (14 MB) 📄 AGI_指数曲线_双语字幕.srt (2.3 KB) 📝 AGI_指数曲线_总结.md (3.2 KB)
快速预览: open ./youtube-clips/20260121_143022/AGI_指数曲线_双语硬字幕.mp4
询问是否继续剪辑其他章节
如果是,返回阶段 4(用户选择) 如果否,结束 Skill 关键技术点 1. FFmpeg 路径空格问题
问题: FFmpeg subtitles 滤镜无法正确解析包含空格的路径
解决方案: burn_subtitles.py 使用临时目录
创建无空格临时目录 复制文件到临时目录 执行 FFmpeg 移动输出文件回目标位置 2. 批量翻译优化
问题: 逐条翻译会产生大量 API 调用
解决方案: 每批 20 条字幕一起翻译
节省 95% API 调用 提高翻译速度 保持翻译一致性 3. 章节分析精细度
目标: 生成 2-5 分钟粒度的章节,避免半小时粗粒度
方法:
理解字幕语义,识别主题转换 寻找自然的话题切换点 确保每个章节有完整的论述 避免机械按时间切分 4. FFmpeg vs ffmpeg-full
区别:
标准 FFmpeg: 无 libass 支持,无法烧录字幕 ffmpeg-full: 包含 libass,支持字幕烧录
路径:
标准: /opt/homebrew/bin/ffmpeg ffmpeg-full: /opt/homebrew/opt/ffmpeg-full/bin/ffmpeg (Apple Silicon) 错误处理 环境问题 缺少工具 → 提示安装命令 FFmpeg 无 libass → 引导安装 ffmpeg-full Python 依赖缺失 → 提示 pip install 下载问题 无效 URL → 提示检查 URL 格式 字幕缺失 → 尝试自动字幕 网络错误 → 提示重试 处理问题 FFmpeg 执行失败 → 显示详细错误信息 翻译失败 → 重试机制(最多 3 次) 磁盘空间不足 → 提示清理空间 输出文件命名规范 视频片段: <章节标题>_clip.mp4 字幕文件: <章节标题>_bilingual.srt 烧录版本: <章节标题>_with_subtitles.mp4 总结文案: <章节标题>_summary.md
文件名处理:
移除特殊字符(/, \, :, *, ?, ", <, >, |) 空格替换为下划线 限制长度(最多 100 字符) 用户体验要点 进度可见: 每个步骤都展示进度和状态 错误友好: 清晰的错误信息和解决方案 可控性: 用户选择要剪辑的章节和处理选项 高质量: 章节分析有意义,翻译准确流畅 完整性: 提供原始和处理后的多个版本 开始执行
当用户触发这个 Skill 时:
立即开始阶段 1(环境检测) 按照 6 个阶段顺序执行 每个阶段完成后自动进入下一阶段 遇到问题时提供清晰的解决方案 最后展示完整的输出结果
记住:这个 Skill 的核心价值在于 AI 精细章节分析 和 无缝的技术处理,让用户能快速从长视频中提取高质量的短视频片段。