它会用 Gemini 先把视频看一遍,从中提取故事线然后构造时间线,过程中它会添加字幕、转场、裁切、生成背景音乐,当然也可以根据你的指示进一步修改。最后可以用 Remotion 来预览,也可以导出到 Final Cut Pro 做进一步调整。



最后导出的视频:https://www.youtube.com/watch?v=KcqQadtzAm8
Gemini 是目前试下来视频支持比较好的模型,虽然内部其实也是在以 1 帧每秒的形式去读截图,但关键是它能够输出视频画面对应的精确时间戳,这样才能用于后续的剪辑。至于视频的 token 消耗其实比我想象得要低,每秒大概 300 token ,用 Gemini 3 Flash 分析一小时的视频也就 $0.5 。
我的视频真的就是旅行的时候随手拍拍,没有脚本,也没有旁白,于是我这个工具就定位在了剪辑这种「无脚本」视频,只专注在剪辑上,并不会用 AI 生成任何的图像或解说(但背景音乐算个例外,是 AI 生成的)。
其实我做这个项目一开始只是想自己用,不然也不会用命令行界面了,现在就有点犹豫后续是改成一个基于网页的界面(甚至可以做 SaaS ),还是直接开源。
1
azhangbing 4 小时 37 分钟前
好像很不错 我也有一堆没有剪辑的视频躺在 NAS 里
|
2
Aprdec 4 小时 29 分钟前
诶哟 不赖
|
3
yuewolf 4 小时 20 分钟前
大佬,你肯定对比过 Gemini 3.1 Flash-Lite 和 Gemini 3 Flash 预览版 吧?
就你实测,它们实际使用上的差别有哪些? 为什么选择了 Gemini 3 Flash 。 关于你的问题,我觉得你可以做一个 SaaS 版上线试一下,主要面向海外, 反正有 AI 写,很快的。 |
4
dassh 4 小时 2 分钟前
没开声音,没细看,感觉没有足够的吸引力
另外,我买的 insta go ultra 好像也有间隙录相,自动剪视频的能力(不过没试过) |
5
jybox OP |
6
february2 3 小时 20 分钟前
👍
感觉以后随身运动相机这类设备会往这个方向发展,设备定时拍摄,然后软件一键式生成比较够看的 vlog ,觉得今年下半年应该就能实现了。 现在 dji nano 影石 go 系列都有间隔拍摄功能,只是剪辑部分不太智能。而像 looki 这种影响部分太弱,最后生成图太轻了,这两者结合,再加上 AI 加持的剪辑,应该不错。 |
7
yean 1 小时 49 分钟前
有意思,发出来试试嘛
|
8
jinxgogo 1 小时 42 分钟前
这个其实我很久之前就试过了,加了卡点转场等等,实测效果比较一般。两个问题:1. AI 主要是不能抓住用户真正想要剪进去的东西。2. 转场效果比较素,好的方式依然是套模版。
|
9
PC9528 1 小时 6 分钟前
|