zhy8777's recent timeline updates

zhy8777

V2EX member #253516, joined on 2017-09-10 16:56:39 +08:00

zhy8777 提问技术话题好玩工作信息交易信息城市相关

Per zhy8777's settings, the topics list is hidden

Deals info, including closed deals, is not hidden

zhy8777's recent replies

Apr 3

Replied to a topic by lynn1su › 程序员 › 用字节火山 coding plan 注意，有个非常坑的点

@ooooo00000ooooo 7.9 一年么？

Apr 3

Replied to a topic by shinkashinra › 程序员 › 各位有没有靠谱的方法可以给团队提供 AI 编程服务的？

私，有企业版合法专线，6 人小公司版，包年专线。
模型可以稳定用官方版

Apr 3

Replied to a topic by pockry › 程序员 › 用 GLM-5 放 Claudecode 里的话，用哪家的 codingplan？

@pockry Coding Plan Pro 以上新增 GLM-5V-Turbo 多模态支持，速冲
👉立即参与「拼好模」： https://www.bigmodel.cn/glm-coding?ic=BN7DKK4W0W

Mar 29

Replied to a topic by zhy8777 › 程序员 › 使用 OpenClaw 一个月，让他自己写了一篇总结（重新排版）

@pxw2002 哈哈，看来是过来人

Mar 26

Replied to a topic by pockry › 程序员 › 用 GLM-5 放 Claudecode 里的话，用哪家的 codingplan？

效果看，感觉还是官方的比较靠谱

Mar 26

Replied to a topic by zhy8777 › OpenClaw › 使用 OpenClaw 一个月，让他自己写了一篇总结

@Lanayaaa 算了。。。我重新发一个吧。。。。我自己也受不了了
原贴怎么删除？

Mar 26

Replied to a topic by zhy8777 › OpenClaw › 使用 OpenClaw 一个月，让他自己写了一篇总结

用 OpenClaw + GLM-5 跑了个 24 小时在线的 AI 军师，一个月下来聊聊真实感受
先说背景：程序员，每天能投入 12 小时搞副业/创业。一直想搞个能真正"记住我"、能主动干活的 AI 助手，之前试过好几种方案都不满意：
<ul>
<li>直接调 API：每次对话从零开始，没有记忆，聊完就忘</li>
<li>ChatGPT GPTs：封闭生态，能力有限，定制性差</li>
<li>Coze/Dify：平台限制太多，部署不够灵活</li>
<li>自建 Agent 框架：开发成本太高，维护费劲</li>
</ul>
上个月发现了 OpenClaw ，折腾到现在刚好一个月，来做个阶段复盘。
<h2>我的部署方案</h2>
硬件很普通：一台腾讯云轻量服务器（ 2C2G ），OpenClaw Gateway 常驻运行，接飞书 Bot 作为聊天入口，模型用的智谱 GLM-5-turbo （ 200K 上下文，128K 输出）。
说人话就是：我在飞书上有个叫"军师"的 AI 助手。它不是那种你问一句答一句的工具人——它记得我之前聊过的所有事，有自己的记忆系统和人格，能搜网页、写代码、操作浏览器、管待办、读写飞书文档，而且每 30 分钟会自动"醒"一次帮我扫描赚钱机会。
不用的时候它就安静待着，有事直接飞书消息喊就行，和跟同事聊天没区别。
<h2>第一个月都干了什么</h2>
<h3>第一周：搭基建</h3>
给军师写了完整的人格设定文件（ SOUL.md ），定义了它的身份、行为准则、沟通协议。搞了一套记忆系统，核心是三层结构：
<ul>
<li><strong>SOUL.md</strong>：最高准则，定义"我是谁"</li>
<li><strong>MEMORY.md</strong>：长期记忆，跨会话持久化</li>
<li><strong>memory/YYYY-MM-DD.md</strong>：每日日志，记录当天事件</li>
</ul>
还配了待办任务管理，让军师能自己追踪任务进度。这周算是把"骨架"搭起来了。
<h3>第二周：装技能，接外脑</h3>
从 ClawHub （ OpenClaw 的技能市场）装了一堆技能包：
<ul>
<li><strong>浏览器自动化</strong>：让它能操作网页、截图、填表</li>
<li><strong>Tavily 搜索</strong>：接入后军师终于能实时上网查资料了</li>
<li><strong>self-improving</strong>：自我进化机制，它能从错误中学习</li>
<li><strong>飞书文档读写</strong>：直接操作飞书云文档</li>
</ul>
这周最大的变化是军师从"只能聊天的工具"变成了"能干活的助手"。
<h3>第三周：整理内务，优化效率</h3>
早期犯了个错：什么文档都往 workspace 里塞，各种草稿、调研报告、临时笔记全堆在一起。结果 system prompt 轻松吃掉 30K+ token ，每次对话都要加载一堆无关内容。
做了次大清理：
<ul>
<li>核心文档从 19 个精简到 6 个（ SOUL/AGENTS/MEMORY/USER/HEARTBEAT/TOOLS ）</li>
<li>非核心文档全部归档到 archive/ 目录</li>
<li>消除文档间重复内容</li>
</ul>
清理完之后，system prompt 从 30K+ 降到 21K ，缓存命中率直接拉到 99%。这意味着大部分 token 都是缓存命中的，不用重复计费。
同时配了心跳机制（每 30 分钟触发一次），让军师定期自动扫描副业机会、检查待办任务、推送有价值的信息。
<h3>第四周：干实事</h3>
这周开始让军师做真正的项目：
<p><strong>中国入境游英文站</strong>——用 Hexo + Butterfly 主题搭的博客站，目标是做 SEO 流量变现。30 篇选题库，已完成 11 篇。配了完整的自动化流水线：每天早 7 点自动从选题库取下一篇 → 写文章 → hexo 编译 → 部署到 nginx → 推送飞书通知。整个过程全自动，不用我操心。</p>
<p><strong>跨境电商调研</strong>——让军师帮我研究了一人公司做跨境的冷启动方案，从选平台、选品、物流到引流，30 天落地计划。还研究了小红书虚拟产品市场、潘家园摊位 ROI 分析等。</p>
<p><strong>股票行情查询</strong>——装了个 A 股实时行情技能，输入 6 位代码就能查股价、涨跌、市值。</p>
<p><strong>nginx 自部署</strong>——因为容器没 sudo 权限，nginx 装不了，最后手动编译到 workspace 下搞定。</p>
中间还试了个赛博算命小程序，快速验证后觉得不靠谱，两天就砍了。框架代码保留着，没浪费太多。
<h2>踩过的坑</h2>
<p><strong>1. 上下文膨胀（最头疼的）</strong></p>
军师不是文档库，核心文件越少越好。早期什么都往 workspace 里塞，token 飙得飞快。后来悟了：信息该归档归档，核心文件只保留当前有效信息。MEMORY.md 精简到 1KB ，历史全放 archive/。
<p><strong>2. nginx 部署</strong></p>
容器环境禁止提权（ no new privileges ），apt install nginx 没戏。最后手动编译 nginx 到 workspace 下。而且 gateway 重启后 nginx 不会自动启动，踩了两次才发现这个问题，每次重启都得手动拉起来。
<p><strong>3. cron 定时任务</strong></p>
OpenClaw CLI 的 cron add 命令经常 WebSocket 报错，折腾了半天。最后直接编辑 cron/jobs.json 文件然后重启 gateway ，暴力解决。
<p><strong>4. 子 agent 管理过度设计</strong></p>
早期配了 PM 、开发、架构师、QA 四个子 agent 角色，觉得挺酷。实际用下来发现完全用不上，沟通成本太高，一个军师全搞定更高效。全部清理归档。
<p><strong>5. 网关重启的连锁反应</strong></p>
gateway 一重启，cron 任务状态、正在进行的操作都可能中断。后来养成了习惯：重启前先记录当前任务进度，重启后主动推送恢复通知。
<h2>Token 消耗和成本</h2>
说实话没花多少钱。几个关键数据：
<ul>
<li>模型：GLM-5-turbo ，200K 上下文</li>
<li>当前 system prompt：约 21K token</li>
<li>缓存命中率：99%（ 21K 中 21K 是缓存）</li>
<li>每次对话实际新增 token：几百到几千</li>
<li>一个月下来，月度额度用了不到 2%</li>
</ul>
核心省钱技巧就是做好文档精简和缓存管理。OpenClaw 的缓存机制是 key-value 匹配，只要 system prompt 不频繁变动，绝大部分 token 都是缓存命中的，不重复计费。
200K 上下文也确实够用。跑复杂的长文档分析、多步骤任务规划都不会截断。
<h2>日常使用体验</h2>
几个真实的场景：
<p><strong>早上 7 点</strong>——军师自动推一条信息汇总，包括昨晚扫描到的赚钱机会、待办提醒、行业动态。我醒了就能看到，不用主动去查。</p>
<p><strong>工作日白天</strong>——随时飞书消息问问题。比如"帮我查一下拼多多虚拟产品的利润率"、"给我出一个跨境电商的选品策略"。军师会自动搜网页、整理数据、输出方案。</p>
<p><strong>写代码时</strong>——直接让它帮我写部署脚本、调试配置文件、操作 git 。比 Copilot 更灵活，因为它能直接在我的服务器上执行命令。</p>
<p><strong>做内容时</strong>——让军师帮我批量生成小红书笔记、公众号文章、英文博客。它能搜竞品、分析热门话题、按平台风格输出。</p>
<p><strong>晚上</strong>——有时候睡前想到个点子，随手发条消息。第二天早上军师已经把调研做完了，连方案都准备好了。</p>
<h2>为什么选 OpenClaw + GLM 这个组合</h2>
OpenClaw 最对胃口的地方：
<ol>
<li><strong>多通道原生支持</strong>——飞书、Telegram 、Discord 、QQ 等随便接，我选飞书因为平时办公用得多</li>
<li><strong>技能生态（ ClawHub ）</strong>——搜索、浏览器自动化、TTS 等装上就能用，不用自己造轮子</li>
<li><strong>心跳 + cron</strong>——让 AI 真正能"7×24 在线"，不是只在对话时才响应</li>
<li><strong>文件系统做记忆</strong>——简单粗暴但有效，markdown 文件比向量数据库好调试一万倍</li>
<li><strong>模型随便换</strong>——不绑定特定厂商，今天用 GLM 明天想换 Claude 随时换</li>
<li><strong>自部署</strong>——数据在自己服务器上，不用担心隐私</li>
</ol>
GLM-5-turbo 的优势：
<ul>
<li>便宜，单价比 GPT-4 便宜很多</li>
<li>200K 上下文够大，复杂任务不截断</li>
<li>中文能力强，毕竟是国产模型</li>
<li>128K 输出，长文生成没问题</li>
</ul>
<h2>一些使用建议</h2>
如果你也想搞一个类似的 AI 助手，几个经验：
<ol>
<li>先想清楚你要它干什么，别一上来就堆功能</li>
<li>记忆系统用文件就行，别上来就搞向量数据库</li>
<li>核心文档越少越好，定期清理</li>
<li>技能按需装，别贪多</li>
<li>心跳任务要设置合理的触发频率，太频繁浪费 token</li>
<li>给 AI 一个明确的人格和行为准则，比什么都重要</li>
</ol>

Mar 26

Replied to a topic by zhy8777 › OpenClaw › 使用 OpenClaw 一个月，让他自己写了一篇总结

@apacheinsky 哈哈，飞书卡片格式，贴进来就没有 markdown 格式了

Mar 26

Replied to a topic by stdout › 程序员 › 大家每天纯对话模式用多少 token？

借楼打广，我是 GLM/Minimax 国产套餐，感觉 GLM 适合干活，Minimax 适合聊天

GLM： https://www.bigmodel.cn/glm-coding?ic=BN7DKK4W0W
Minimax： https://platform.minimaxi.com/subscribe/token-plan?code=5vPEdERN8M&source=link

Mar 20

Replied to a topic by aicodingsh › 推广 › 领$10-稳定 - Claude Code 用户看过来

中转站吗？模型对应真实不？

» More replies by zhy8777