
1
wuhen8 18 小时 28 分钟前
开源吗,能不能自己部署
|
3
mooncakeSec 17 小时 6 分钟前
怎么做的优化呢,判断用户语音输入结束和打断,是 gemini 提供的吗
|
4
lonccc 16 小时 55 分钟前
为什么要不依赖框架做呢,和 livekit 比有什么不同或者优势?
|
5
LuliYanng OP @mooncakeSec 不是 gemini 仅仅作为 llm ,判断输入结束和打断是客户端的 vad 和 turn detection 来处理,不过这一块做得还不是特别好
|
6
LuliYanng OP @lonccc 出发点当然是纯粹为了学习😁,跟 livekit 这种成熟产品比不敢说能有什么优势,毕竟也不是奔着做一个 livekit 竞品去的。能够了解基本的实现,也有帮助认清现在形形色色的 AI 产品新闻,不至于天天被营销号带节奏。本来是打算先自己不借助框架实现一个 agent 的,刚好朋友推了 typeless 给我,我就先做这个了。
|
7
WasteNya 16 小时 7 分钟前 via Android
一个月的 token 费用需要多少钱,特别是 4k 屏幕吗话?
|
8
LuliYanng OP @WasteNya token 不好估算,目前刚做了几天,用的也不多。但用的供应商也不便宜就是了,如果有兴趣,我把客户端开发好给大家用用,有一定的数据我才能预估 token 用量。至于你说的 4k 屏幕,这用量跟屏幕似乎没啥关系😅
|
9
uid106 15 小时 38 分钟前 via iPhone
挺好的,感觉语音很自然,有自定义音色和性格的选择就更好了
|