V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
jybox
V2EX  ›  分享创造

做了个 CLI 工具用 AI 来剪辑 vlog 效果意外地还不错

  •  
  •   jybox ·
    jysperm · 4 小时 44 分钟前 · 439 次点击

    它会用 Gemini 先把视频看一遍,从中提取故事线然后构造时间线,过程中它会添加字幕、转场、裁切、生成背景音乐,当然也可以根据你的指示进一步修改。最后可以用 Remotion 来预览,也可以导出到 Final Cut Pro 做进一步调整。

    最后导出的视频:https://www.youtube.com/watch?v=KcqQadtzAm8

    Gemini 是目前试下来视频支持比较好的模型,虽然内部其实也是在以 1 帧每秒的形式去读截图,但关键是它能够输出视频画面对应的精确时间戳,这样才能用于后续的剪辑。至于视频的 token 消耗其实比我想象得要低,每秒大概 300 token ,用 Gemini 3 Flash 分析一小时的视频也就 $0.5 。

    我的视频真的就是旅行的时候随手拍拍,没有脚本,也没有旁白,于是我这个工具就定位在了剪辑这种「无脚本」视频,只专注在剪辑上,并不会用 AI 生成任何的图像或解说(但背景音乐算个例外,是 AI 生成的)。

    其实我做这个项目一开始只是想自己用,不然也不会用命令行界面了,现在就有点犹豫后续是改成一个基于网页的界面(甚至可以做 SaaS ),还是直接开源。

    第 1 条附言  ·  2 小时 15 分钟前
    有类似(非专业随意拍摄的无脚本 vlog )剪辑需求的朋友可以联系我交流试用,V2EX 主页有 Telegram 或 Twitter 私信。
    9 条回复    2026-04-14 17:46:13 +08:00
    azhangbing
        1
    azhangbing  
       4 小时 37 分钟前
    好像很不错 我也有一堆没有剪辑的视频躺在 NAS 里
    Aprdec
        2
    Aprdec  
       4 小时 29 分钟前
    诶哟 不赖
    yuewolf
        3
    yuewolf  
       4 小时 20 分钟前
    大佬,你肯定对比过 Gemini 3.1 Flash-Lite 和 Gemini 3 Flash 预览版 吧?

    就你实测,它们实际使用上的差别有哪些?

    为什么选择了 Gemini 3 Flash 。

    关于你的问题,我觉得你可以做一个 SaaS 版上线试一下,主要面向海外, 反正有 AI 写,很快的。
    dassh
        4
    dassh  
       4 小时 2 分钟前
    没开声音,没细看,感觉没有足够的吸引力
    另外,我买的 insta go ultra 好像也有间隙录相,自动剪视频的能力(不过没试过)
    jybox
        5
    jybox  
    OP
       3 小时 57 分钟前
    @yuewolf 实际上有两个环节:
    - 视频内容分析(从视频生成内容摘要),Flash 或 Lite 都可以,价格其实也只是差了一倍而已,所以直接用 Flash 了
    - 视频剪辑(编辑时间线),这个就需要模型有比较好的注意力管理和工具调用能力,至少需要 Flash ,要效果更好就需要 Pro


    @dassh 很正常,因为本来就是随手拍拍,更多还是自己留个回忆,然后把几十 G 的原始视频删掉。
    february2
        6
    february2  
       3 小时 20 分钟前
    👍
    感觉以后随身运动相机这类设备会往这个方向发展,设备定时拍摄,然后软件一键式生成比较够看的 vlog ,觉得今年下半年应该就能实现了。
    现在 dji nano 影石 go 系列都有间隔拍摄功能,只是剪辑部分不太智能。而像 looki 这种影响部分太弱,最后生成图太轻了,这两者结合,再加上 AI 加持的剪辑,应该不错。
    yean
        7
    yean  
       1 小时 49 分钟前
    有意思,发出来试试嘛
    jinxgogo
        8
    jinxgogo  
       1 小时 42 分钟前
    这个其实我很久之前就试过了,加了卡点转场等等,实测效果比较一般。两个问题:1. AI 主要是不能抓住用户真正想要剪进去的东西。2. 转场效果比较素,好的方式依然是套模版。
    PC9528
        9
    PC9528  
       1 小时 6 分钟前
    我也在做一个自动视频剪辑的 cli, 用的是开源的 Qwen3VL 本地跑 50 分钟视频大概要 25 分钟左右, 现在用来剪辑直播里面的舞蹈片段
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3590 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 10:52 · PVG 18:52 · LAX 03:52 · JFK 06:52
    ♥ Do have faith in what you're doing.