V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jayn1985
V2EX  ›  问与答

关于我做了一个自嗨的语音助手,愿景是小白也能通过自然语言轻松操控电脑或手机(跪求大佬指点)

  •  
  •   jayn1985 · 1 天前 · 397 次点击
    因为市面上没有一个真正好用的语音助手,帮助我释放双手,并且现在主流的智能体助手,像豆包,Gemini 等,因为过于通用化而显得有时候很弱智和胡说八道,也出于对童年魔幻手机里的傻妞这样的人工智能的憧憬,所以自嗨了一个语音智能体

    这个智能体能够记得我上次的对话,熟悉我的情绪,不会一味的附和我,甚至在我偷懒提问时直接“怼”我,引导我独立思考,会不会组成一个真正的伙伴

    它能够扮演任何角色,导师,朋友,商业精英等等(计划中)

    它还能根据对话推理你下达的任务与期望的目标

    它能经过同意,操控电脑或手机,如清理垃圾,打开应用,使用应用(下单淘宝购物,剪辑视频)(计划中,成本爆炸)

    现阶段已完成一部分,暂时没放服务器里

    目前一个人/小团队全栈开发,有些技术方案可能是“能跑就行”,跪求大家多提意见(啥意见都行):

    关于记忆的 TTL 和置信度算法:目前是基于规则的简单衰减,在大佬做长期记忆检索( RAG )时,有没有更轻量、更智能的本地管理或图数据库推荐?

    IPC 通信的流畅性:Node.js 和 Python 之间传音频目前采用了“传本地文件路径 + TCP Socket 传 JSON”的方案,感觉还是有点,有没有更好的本地跨进程通信最佳实践?

    在 MVP 阶段,大佬们觉得哪些功能是伪需求,应该断断续续聚焦核心吗
    3 条回复    2026-04-22 22:23:59 +08:00
    cpstar
        1
    cpstar  
       1 天前
    你说的可是 openclaw+遥控器 skill ?

    亦或者是粗粮或者水果乃至遥遥领先的全家桶?
    cpstar
        2
    cpstar  
       1 天前
    不好意思,想成家电了。

    但是遥控电脑和手机,不更是虾或者马么
    jayn1985
        3
    jayn1985  
    OP
       1 天前
    @cpstar 哈哈,看到"遥遥领先“”笑死了
    确实,论复杂的系统级编排、生态丰富度以及沙箱隔离机制,虾和马 已经是目前的行业标杆。现在做桌面自动化,基本绕不开这两座大山。
    但虾 和 马 部署门槛太高了(重度依赖 Docker 隔离和技能权限配置),而我的定位并非对标重型自动化框架,而是探索低门槛 + 情感化的本地桌面级交互
    是不是太过异想天开了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3760 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 00:18 · PVG 08:18 · LAX 17:18 · JFK 20:18
    ♥ Do have faith in what you're doing.