爱意满满的作品展示区。
lookforadmin2

分析了 Browser MCP、CodeX、Kimi WebBridge 后,我做了一个增强版的开源 AI Agent 浏览器控制实现

  •  
  •   lookforadmin2 · 3 days ago · 712 views

    最近看了几个 AI 控制浏览器的方案,各自都有些不太满意的地方:

    • CodeX:经常开全新窗口,没有登录态。

    • Playwright MCP:想继承登录态得额外,步骤多。

    • Kimi WebBridge:功能做得不错,但闭源。

    总感觉这玩意儿我上我也行,于是自己写了一个:OpenBridge

    和上面几个的主要区别:

    • 直接复用你当前 Chrome 的登录态,不用重新登录

    • 完全开源,Cookie 这种敏感数据全在本地,不经过任何外部服务

    • 标准 MCP 协议 + 本地 HTTP API ,不绑定客户端

    额外做的一些增强:

    • 支持 AI 自动给标签页重命名 ID ,方便管理

    • 一键关闭浏览器标签

    • AI 控制开关,不想让它操作的时候可以直接关掉

    • MCP 和 HTTP API 双接口支持

    安装很简单:

    Chrome 开发者模式加载一下已打包好的 zip 扩展就行了 : https://github.com/60ke/openBridge/releases#:~:text=openbridge%2Dextension%2Dchrome%2Dv0.1.0.zip Chrome 商店上架正在审核中,后续可以直接从商店安装。

    然后直接让 Claude Code 、CodeX 、Kimi 、OpenCode 甚至 Trace 帮你跑这条命令:

    帮我安装:curl -fsSL https://raw.githubusercontent.com/60ke/openBridge/master/install.sh | bash
    

    顺便说一个其中的一个好处: 可以通过网页直接调 Gemini 、ChatGPT 这些 AI 的生图能力,不占用你 Coding 工具的额度。

    最后放 ai agent 调用 gemini 生成图片的效果图:

    db1e33cf4c22a7a1372a3b3f080e3602 01_openbridge_ai_browser_control_1280x800

    仓库地址: https://github.com/60ke/openBridge

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   929 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 19:24 · PVG 03:24 · LAX 12:24 · JFK 15:24
    ♥ Do have faith in what you're doing.