V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
MaskerPRC
V2EX  ›  分享创造

我做了一个「浏览器增强工具」,它用 AI 帮你把网页操作「自动化」

  •  
  •   MaskerPRC · 21 小时 44 分钟前 · 719 次点击

    我叫 Loopsaaage 佳恒,现在在做一个「 1 年做 100 个 AI 小产品」的个人挑战。最近正折腾的这个东西,可能对每天在浏览器里打转的打工人有点用,就来 V 站跟大家汇报一下,也想听听大家真实的吐槽。

    先简单交代一下背景。我之前在华为、腾讯待过,做过游戏开发,也做过 AI 相关的系统。平时也喜欢折腾各种电子设备和新模型。这两年最直观的感觉是:模型确实越来越厉害,但真要落到「提高日常电脑办公效率」上,其实还没到那个爽点。大部分人用 AI ,还停留在「问点问题」「写点文案」「改改句子」这种层面。可是真正消耗人精力的,往往是浏览器里的那些重复步骤:打开好几个网站、来回切标签、复制粘贴、点一堆按钮、填一堆一样的表单。

    所以我现在做的这个产品,叫「全视界( Tab Hive )」。它想解决的核心问题只有一个:把你在多个网站之间的一整套固定操作,用可视化的方式串起来,然后让引擎和 AI 自动帮你跑完。

    如果用一句话来形容这个东西:把每一个网页当成可以连线的「节点」,数据可以在这些节点之间流动,而点击、输入这些操作也可以像搭积木一样编排起来。

    目前已经做了几块比较核心的功能:

    1. 多站点同屏展示

    这个是最直观的部分。你可以在一块无限画布上,同时摆 2×2 、3×3 ,甚至更多个网页。每个网页都是活的,可以正常操作。

    这对几类人比较有用:

    • 做运营、要看一堆后台数据的人,可以把几个后台都摊在一屏上;
    • 做电商比价的,可以把同一商品在不同网站的页面放在一块;
    • 做数据看板的,也可以把展示页、监控页、工具页都摆一起。

    因为桌面端是用 Electron 做的,没有浏览器里常见的 CORS 限制,所以大部分网站都能塞进来,银行、社交媒体、各种后台都可以正常打开和操作。

    2. 会话隔离 + 代理隔离

    每个小窗都有独立的 Session ,Cookie 互不影响。实际用起来,它就变成了一个「多账号浏览器」。同一个网站,你可以在一块画布上同时登录多个账号,各自互不干扰。

    再加上每个网页可以单独挂代理,你就可以做到:

    • 不同地区的账号分开跑;
    • 测试环境和生产环境分开开;
    • 不同业务线、不同商铺,各自用自己的 IP 和账号。

    这个对电商卖家、运营、需要多地区访问和管理多账号的人来说,应该会挺刚需。

    上面两点其实还只是「多窗口浏览器」。真正有意思的是第三块。

    3. AI 驱动的多网页工作流编排

    在这个工具里,每个网页不只是一个普通的窗口,而是一个「有配置的节点」。

    你可以在某个网页上,用可视化的方式框选元素:鼠标移动上去会高亮,点击可以自动生成选择器。你可以给这些元素起名字,比如「价格」「活动信息」「提交按钮」「搜索框」之类。然后对每个元素定义两类东西:

    • 从这里要「提取什么数据」;
    • 可以对它「执行什么操作」(点击、输入、滚动等)。

    在这个基础上,我设计了三种节点类型:

    • 网页节点:和真实网页打交道,负责抓数据、点按钮、填表单;
    • 流程节点:对数据做处理,比如过滤、转换、计算、组合;
    • 控制节点:根据数据结果去操控其他网页节点,比如「如果价格低于多少,就去 XX 页面下单」。

    节点之间有两种连线:

    • 数据连线:数据怎么在节点之间流动;
    • 执行连线:执行顺序怎么走。

    整体看上去有点像简化版的 Node-RED ,只不过它作用在真实网页上,而不是纯接口。

    用几个具体一点的例子来说明能干啥:

    例子 1:电商价格监控

    • 你在画布上打开几个电商平台,同一件商品的详情页;
    • 网页节点负责从每个页面抓「当前价格」「活动价」「满减信息」这些数据;
    • 流程节点把这些数据算一遍,比如统一成同一种单位、加上运费、算折扣后最终价格;
    • 最后,把结果丢进你自己做的一个「价格看板」网页里,自动填出一个列表或表格。

    你平时只要看这个看板页面,就能知道每个平台当前的实际到手价,而不用每天手动打开一堆标签一点点比。

    例子 2:多站点表单批量填写

    • 你有一份简历或者一套公司信息,需要丢到很多网站:投简历、注册账号、填写商家资料、提交工单等;
    • 你可以在流程节点里,先把这份通用信息整理好,比如「姓名」「电话」「公司名」「介绍」「链接」等字段;
    • 然后用控制节点驱动不同网站的表单,让它们自动去对应的输入框里填这些字段,并且点击提交。

    你只需要前面配置一次,后面要上新网站,只要把对应的输入框标记出来,拖拖线,流程就能直接复用。

    例子 3:多账号批量操作

    • 你打开三个一模一样的运营后台页面;
    • 每个页面挂不同的账号和代理;
    • 控制节点驱动这三个页面同步干同一件事,比如一起发帖、一起发优惠券、一起拉报表。

    比你一个账号一个账号地登录、切浏览器、来回点,要轻松得多。

    4. 执行引擎和调试体验

    执行这一块,现在已经有一整套比较顺的流程:

    • 引擎会自动找到起始节点,按执行连线往下跑;
    • 执行过程中有实时日志,你可以看到在哪个节点做了什么;
    • 每个节点的输入和输出数据可以直接展开查看;
    • 如果哪个节点出错了,会标红,并给出简单的堆栈信息,方便你查问题。

    对平时喜欢搭工作流、玩自动化的人来说,这一套应该比较好上手,至少调试不会太痛苦。

    5. 和 AI 相关的部分(目前的规划)

    现在 AI 这块主要是把底层接口和空间预留出来,具体的能力准备先从两个方向做:

    • 自然语言生成工作流草稿:
      你可以直接打一段需求,比如「从 A 、B 、C 三个站抓这个商品的价格和库存,算完之后写到 D 站的一个表格里」,AI 帮你先搭一个大致的节点和连线框架,你再自己细调、补充规则。

    • 智能识别页面元素和提取规则:
      简单说,就是尽量减少你和各种复杂选择器死磕的时间。比如 AI 帮你猜「这个列表每一行的结构」「这个页面所有价格字段」「这个表单里所有必填项」,然后给你几个候选方案,你选一下就能用。

    6. 挑战记录和后续

    我自己「 1 年 100 个产品」的进度和过程,都放在这个站点上:
    https://100.agitao.net
    「全视界 / Tab Hive 」是里面相对比较重的一个项目,我会长期迭代,不是玩票性质的 demo 。

    如果你平时的工作里,有这种「每天都在几个固定的网站之间,重复做几乎一样的事情」的场景,或者你已经在用 AutoHotkey 、Playwright 、Selenium 之类的工具,但又不太想写脚本、写代码,欢迎在评论里跟我说一下你真实的场景:

    • 你现在具体是怎么操作的;
    • 哪些步骤最烦、最容易出错;
    • 你希望能「一键搞定」的那一刻是什么样子。

    我这边会优先把这些高频、痛点明确的场景做成内置模板,方便大家直接拿来用,也能帮我验证一下,这个方向到底值不值得继续重仓做下去。

    9 条回复    2025-12-19 15:44:44 +08:00
    ajan
        1
    ajan  
       19 小时 0 分钟前
    已收藏
    lingyired
        2
    lingyired  
       18 小时 55 分钟前
    https://100.agitao.net 这个网站用的是什么 UI 框架和主题? 感觉很有意思
    leyoumake1997
        3
    leyoumake1997  
       18 小时 40 分钟前
    牛的牛的。求 ui 主题
    ns2250225
        4
    ns2250225  
       18 小时 34 分钟前   ❤️ 1
    @lingyired #2 应该是用了 Neo Brutalism 新粗野/新野獸風格
    510908220
        5
    510908220  
       17 小时 56 分钟前
    厉害,楼主朝气蓬勃,以后很有前途
    Peiiii
        6
    Peiiii  
       16 小时 44 分钟前 via Android
    很有趣,有过相关的想法。当时的考虑是做成浏览器插件,AI 生成自动化脚本,提供快捷操作。没考虑到把多个网站串到一个流程中。
    MaskerPRC
        7
    MaskerPRC  
    OP
       16 小时 4 分钟前
    项目完全开源,感兴趣的可以直达下载最新版本: https://github.com/MaskerPRC/tab-hive/releases/latest
    MaskerPRC
        8
    MaskerPRC  
    OP
       16 小时 4 分钟前
    @510908220 感谢
    bigShrimp8577
        9
    bigShrimp8577  
       15 小时 55 分钟前
    对我这种,好像没啥用
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1029 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 23:39 · PVG 07:39 · LAX 15:39 · JFK 18:39
    ♥ Do have faith in what you're doing.