video-use 上手:让 Coding Agent 真的剪出 final.mp4

作者:Administrator 发布时间: 2026-05-01 阅读量:6 评论数:0

视频剪辑进入 Agent 工作流以后,最容易被误解成“一句话生成视频”。真正有用的方向不是凭空生成,而是把已有素材变成可审计、可重跑的编辑流程:识别素材、切掉废话、调色、加字幕、加动画、渲染、检查边界,再输出 final.mp4。

browser-use/video-use 正是这个方向。它让 Claude Code、Codex、Hermes、OpenClaw 这类有 shell 能力的 Agent 接管剪辑流水线:原始视频放进目录,Agent 读取安装说明和 Skill,调用 ffmpeg、Manim、Remotion、PIL 等工具,最后在 `edit/` 目录生成结果。

它的重点不是“AI 会剪视频了”,而是把剪辑变成一组脚本化、可复查、能沉淀记忆的步骤。

先给 Agent 工具留一台干净测试机这类 GitHub 新工具通常会动文件、跑命令、起服务,最好先在隔离环境里验收,再接入生产项目。需要临时 VPS、开发机或自建实验环境,可以看看雨云的服务器方案。查看雨云服务器方案 →

适合处理什么视频

更适合:

  • talking head 口播。
  • 教程录屏。
  • 采访素材。
  • 产品演示。
  • 旅行或活动 montage。
  • 需要统一字幕样式的短视频。

不适合一开始就要求它做复杂商业广告、强剧情短片或素材版权不清的内容。Agent 剪辑能提高效率,但不能替你解决审美判断和授权问题。

安装思路

README 推荐把安装交给 Agent:

Set up https://github.com/browser-use/video-use for me.
Read install.md first to install this repo, wire up ffmpeg, register the skill with whichever agent you're running under, and set up the ElevenLabs API key — ask me to paste it when you need it.

如果手动安装,大致是:

git clone https://github.com/browser-use/video-use ~/Developer/video-use
cd ~/Developer/video-use

然后按 `install.md` 安装依赖、注册 skill、配置 ffmpeg 和需要的 API key。

先确认 ffmpeg:

ffmpeg -version
ffprobe -version

没有 ffmpeg,后面都别谈。

目录约定很关键

不要把素材散在桌面。建议一个项目一个目录:

video-project/
  raw/
    take-01.mp4
    take-02.mp4
  notes.md
  edit/

进入素材目录后启动 Agent:

cd /path/to/video-project
claude

或者 Codex、Hermes、OpenClaw。

然后给任务:

把 raw/ 里的素材剪成 90 秒发布版。
先盘点素材,不要立刻渲染。
输出剪辑策略,等我确认后再生成 final.mp4。

这一步很重要。不要让 Agent 一上来就开始乱剪。

一个靠谱剪辑流程

建议让 Agent 分五步走:

1. inventory:列出素材、时长、分辨率、音轨。
2. plan:给出剪辑结构和保留片段。
3. rough cut:生成粗剪版本。
4. polish:加字幕、调色、音频淡入淡出、动画覆盖层。
5. review:检查切点、字幕、音画同步,再输出 final.mp4。

video-use 的亮点包括:

  • 删除 filler words 和 dead space。
  • 每个切点做 30ms audio fades,减少爆音。
  • 按样式烧录字幕。
  • 通过 Manim、Remotion 或 PIL 生成动画 overlay。
  • 渲染后自检切点边界。
  • 用 `project.md` 保留会话记忆。

字幕和配音要提前定规范

给 Agent 的字幕规范不要太抽象:

字幕规则:
- 中文每行不超过 12 个字。
- 一次显示 1-2 行。
- 关键词用黄色。
- 不要遮挡人物脸部。
- 口播停顿超过 0.4 秒才切字幕。

如果要用 ElevenLabs 或其他语音服务,API key 必须走安全输入,不要写进仓库、日志或最终视频目录。

输出目录要保持干净

video-use 默认把产物放在素材目录旁的 `edit/`,这是好习惯:

edit/
  rough.mp4
  subtitles.ass
  overlays/
  final.mp4
  render.log

每次渲染都应该保留日志和中间文件。视频任务很难一次完美,中间产物越清晰,返工越快。

验收清单

发布前至少检查:

  • `final.mp4` 能正常播放。
  • 音画同步没有明显漂移。
  • 切点没有爆音。
  • 字幕无错字、无遮挡关键画面。
  • 素材版权和人物授权没问题。
  • 生成动画没有错误信息或水印残留。
  • 项目目录不包含 API key。

video-use 的价值不是让 Agent 替代剪辑师,而是把重复剪辑动作沉淀成工程流水线。素材盘点、粗剪、字幕、调色、渲染、自检这些步骤一旦脚本化,Agent 才能真正成为视频生产里的执行助手,而不是只会给剪辑建议的聊天框。

评论