视频剪辑进入 Agent 工作流以后,最容易被误解成“一句话生成视频”。真正有用的方向不是凭空生成,而是把已有素材变成可审计、可重跑的编辑流程:识别素材、切掉废话、调色、加字幕、加动画、渲染、检查边界,再输出 final.mp4。
browser-use/video-use 正是这个方向。它让 Claude Code、Codex、Hermes、OpenClaw 这类有 shell 能力的 Agent 接管剪辑流水线:原始视频放进目录,Agent 读取安装说明和 Skill,调用 ffmpeg、Manim、Remotion、PIL 等工具,最后在 `edit/` 目录生成结果。
它的重点不是“AI 会剪视频了”,而是把剪辑变成一组脚本化、可复查、能沉淀记忆的步骤。
适合处理什么视频
更适合:
- talking head 口播。
- 教程录屏。
- 采访素材。
- 产品演示。
- 旅行或活动 montage。
- 需要统一字幕样式的短视频。
不适合一开始就要求它做复杂商业广告、强剧情短片或素材版权不清的内容。Agent 剪辑能提高效率,但不能替你解决审美判断和授权问题。
安装思路
README 推荐把安装交给 Agent:
Set up https://github.com/browser-use/video-use for me.
Read install.md first to install this repo, wire up ffmpeg, register the skill with whichever agent you're running under, and set up the ElevenLabs API key — ask me to paste it when you need it.如果手动安装,大致是:
git clone https://github.com/browser-use/video-use ~/Developer/video-use
cd ~/Developer/video-use然后按 `install.md` 安装依赖、注册 skill、配置 ffmpeg 和需要的 API key。
先确认 ffmpeg:
ffmpeg -version
ffprobe -version没有 ffmpeg,后面都别谈。
目录约定很关键
不要把素材散在桌面。建议一个项目一个目录:
video-project/
raw/
take-01.mp4
take-02.mp4
notes.md
edit/进入素材目录后启动 Agent:
cd /path/to/video-project
claude或者 Codex、Hermes、OpenClaw。
然后给任务:
把 raw/ 里的素材剪成 90 秒发布版。
先盘点素材,不要立刻渲染。
输出剪辑策略,等我确认后再生成 final.mp4。这一步很重要。不要让 Agent 一上来就开始乱剪。
一个靠谱剪辑流程
建议让 Agent 分五步走:
1. inventory:列出素材、时长、分辨率、音轨。
2. plan:给出剪辑结构和保留片段。
3. rough cut:生成粗剪版本。
4. polish:加字幕、调色、音频淡入淡出、动画覆盖层。
5. review:检查切点、字幕、音画同步,再输出 final.mp4。video-use 的亮点包括:
- 删除 filler words 和 dead space。
- 每个切点做 30ms audio fades,减少爆音。
- 按样式烧录字幕。
- 通过 Manim、Remotion 或 PIL 生成动画 overlay。
- 渲染后自检切点边界。
- 用 `project.md` 保留会话记忆。
字幕和配音要提前定规范
给 Agent 的字幕规范不要太抽象:
字幕规则:
- 中文每行不超过 12 个字。
- 一次显示 1-2 行。
- 关键词用黄色。
- 不要遮挡人物脸部。
- 口播停顿超过 0.4 秒才切字幕。如果要用 ElevenLabs 或其他语音服务,API key 必须走安全输入,不要写进仓库、日志或最终视频目录。
输出目录要保持干净
video-use 默认把产物放在素材目录旁的 `edit/`,这是好习惯:
edit/
rough.mp4
subtitles.ass
overlays/
final.mp4
render.log每次渲染都应该保留日志和中间文件。视频任务很难一次完美,中间产物越清晰,返工越快。
验收清单
发布前至少检查:
- `final.mp4` 能正常播放。
- 音画同步没有明显漂移。
- 切点没有爆音。
- 字幕无错字、无遮挡关键画面。
- 素材版权和人物授权没问题。
- 生成动画没有错误信息或水印残留。
- 项目目录不包含 API key。
video-use 的价值不是让 Agent 替代剪辑师,而是把重复剪辑动作沉淀成工程流水线。素材盘点、粗剪、字幕、调色、渲染、自检这些步骤一旦脚本化,Agent 才能真正成为视频生产里的执行助手,而不是只会给剪辑建议的聊天框。