两年实盘 +135%，聊聊我用 Claude Code 搭的多 Agent 投研框架

爱意满满的作品展示区。

做了个 AI 投研系统，4 个 Agent 互相挑刺，结果比我自己分析靠谱多了

你直接问 Claude"帮我分析拼多多值不值得买"，它会给你一篇"一方面...另一方面..."的平衡文。看起来全面，但没法拿来做决策。

我想做的系统必须给出明确倾向：一个合理价格区间，当前价位偏高、合理还是偏低，附上置信度。做不到这一点的分析，对决策没有帮助。

花了一年多，把投研流程拆成了一套多 Agent 对抗系统。项目开源在 GitHub： https://github.com/xbtlin/ai-berkshire

先看产出

拿拼多多举例，系统实际跑出来的结论：

商业模式维度：C2M 有壁垒，好生意 → 3.7/5
财务估值维度：扣现金 PE 仅 6.3x → 4.4/5
行业竞争维度（逆向思考）：护城河比想象中浅，抖音电商 3 年做到 4 万亿 GMV → 3.5/5
风险评估维度：管理层文化有隐患，10 年后不确定 → 2.0/5

一个说"真便宜"，另一个说"不确定就不买"。这种矛盾不是 bug ，是投资决策的真实状态。

完整的报告样本放在仓库 reports/ 目录下，有 100+ 份，随便翻。

核心设计：多 Agent 对抗

/investment-team 会启动 4 个独立的 Claude Code subagent ，每个从不同分析维度（商业模式 / 财务估值 / 行业竞争 / 风险评估）各自搜索网络、各自交叉验证数据、各自给出结论。这不是把一个 prompt 拆成四段再拼回来——是 4 个"分析师"各自做了完整研究，最后由 Team Lead 综合，并且专门有一轮挑战环节：A 的结论要经受 B 、C 、D 的质疑。

单个 LLM 容易自我强化——前面说了看好，后面就不自觉找支撑证据。多 Agent 对抗就是为了打破这个倾向。

最终报告输出分层建议：激进型 / 稳健型 / 保守型各自的仓位和价格区间，加上一个"镜子测试"——5 句话说不清为什么买，就是不该买。

架构

架构图

Skill 层（ 16 个入口）— 定义你要做什么研究
    ↓
Agent 层（ 4 Agent 并行）— 各自搜索、独立判断、互相挑战
    ↓
工具层 — Decimal 精确计算 + 实时检索 + 报告校验

两个工程细节：

不信 LLM 心算。 LLM 算 PE 能算错小数点，港币人民币单位搞混更是常见。所有财务计算走 Python decimal.Decimal，关键数据至少 2 个独立来源交叉验证。还内置了 Benford 定律检测——用首位数字分布异常发现财务数据可疑的线索。

多层纠偏。 AI 最危险的不是给错答案，而是给一个看起来很对但经不起推敲的答案。框架里内置了信息丰富度分级、逆向检验（强制思考"这家公司怎么会死"）、快速否决清单（ 8 条红线一票否决，管理层诚信有问题不管多便宜都直接否决）。

怎么用

npm install -g @anthropic-ai/claude-code
git clone https://github.com/xbtlin/ai-berkshire.git
cp ai-berkshire/skills/*.md ~/.claude/commands/

/investment-team 腾讯           # 4 Agent 并行深度研究
/earnings-review 腾讯 2025Q4    # 财报精读
/quality-screen 茅台, 英伟达     # 快速筛选

实盘记录

附一下自己用这套流程辅助决策的实盘，仅供参考：

2024 实盘收益

2025 实盘收益

指标	2024 全年	2025 至今
我的实盘	+69.29%	+66.38%
标普 500	+23.31%	+16.39%
恒生指数	+17.67%	+27.77%

几个注脚：样本量只有两年，统计上说明不了什么；集中持仓 3-5 只，波动极大；买入决策是人做的，系统只负责研究；工具是投资过程中逐步搭建的，不构成因果关系。

这个帖子不是来说"用 AI 炒股能赚钱"的——收益来自集中持有深度研究过的公司，框架的作用是提高研究效率和分析质量。

已知局限

跑一次完整分析的 token 消耗不小
买入决策仍然依赖人的判断力，工具不能替代

最后

GitHub： https://github.com/xbtlin/ai-berkshire

MIT License ，没有付费版，没有课程，没有星球。有问题直接开 issue ，我都会回。

一个我自己还没想清楚的问题：LLM 做投资研究最大的风险是什么？是幻觉？是数据滞后？还是给了你虚假的信心让你加大仓位？欢迎聊聊。

如果你想看某只股票跑出来什么样，评论区留名字（美股/港股），我挑几个跑一下贴上来。

投资

智能

系统

231 replies • 2026-07-11 21:18:50 +08:00

1 2 3

❮

❯

Brightt

Jun 23

牛逼有 Codex 版本吗，Claude code 门槛还是有点高了

DXpro

Jun 23

“买入决策仍然依赖人的判断力，工具不能替代”

这不是扯淡吗？

xbtlin

Jun 23

@Brightt 暂时没有 Codex 版本，整套系统基于 Claude Code 的 Skill 和 subagent 机制搭建，不是简单的 prompt 集合，迁移工作量不小。门槛其实还好，npm install -g
@anthropic-ai/claude-code 一行装完，skills 文件复制到 ~/.claude/commands/ 下就能用，不需要自己搭环境或写代码。

xbtlin

Jun 23

@DXpro 哈哈理解你的质疑。系统告诉你拼多多严重低估，但真要把 30% 仓位砸进去的时候手还是会抖——跌了再跌怎么办？拿半年不涨割不割？看清楚和下得了手是两回事。

lyonll

Jun 23

牛逼比自己瞎买好很多

EndlessMemory

Jun 23

楼主研究这个花了多久

flowzeta

Jun 23

很有启发，但“用 claude code 两年实盘+xx%”，claude code 貌似还没发布够两年吧

aatrox

Jun 23

支持 A 股么

Inn0Vat10n

Jun 23

今年至今表现如何?

idblife

Jun 23

帮跑一下 GOOGLE ，微软，SPACEX ，多谢

millken

Jun 23

没看出是实盘啊

Mirana

Jun 23

前面的分析看起来很棒，但是 24 年 25 年大模型和 agent 都还不怎么流行，怎么证明这些收益都是这套系统带来的呢，我看了下我 25 年整年也有 77%的收益

Fish1024

Jun 23

恭喜楼主挣钱。

weofuh

Jun 23

你是：
1. 价值投资？价值投机？纯投机？
2. 长期？中期？短期？
3. 科创 50 还是血包股？

这些都是个人风险偏好的问题，AI 工具没法给你做出决策，真的就只是分析（基本面+少量技术）

bjfane

PRO

Jun 23

简单来说当场就 star 了

xbtlin

Jun 23

@flowzeta 两年实盘是真实的，这些实践经验通过 Claude Code 形成体系了，就是这个项目

xbtlin

Jun 23

@EndlessMemory 研究投资可能有快 10 年了，本身从事 AI 行业，所以酝酿应该挺久的，做这个项目是几个月前

xbtlin

Jun 23

@Mirana 理解，准确的说我是现有投资框架，然后通过 Claude Code 把这个套投资框架沉淀成这个项目。我自己现在还在用这个项目，反正几乎所有的研究都会上传到这个项目

digitv

Jun 23

你这是先知道什么股票再去分析的吧？如何决策买点和卖点呢？另外支持使用国产的模型分析不

xbtlin

Jun 23

@aatrox 支持的，report 里面有 A 股的公司的

xbtlin

Jun 23

@idblife 好，我给你跑一下

xbtlin

Jun 23

@digitv 也有产业分析的，比如用/industry-research 半导体，支持国产模型的，claude code 的框架+国产模型没问题

xbtlin

Jun 23

“如果你想看某只股票跑出来什么样，评论区留名字（美股/港股），我挑几个跑一下贴上来。”

增加下：支持 A 股，支持 A 股

nanyancc

Jun 23

我没有详细看你的 GitHub 仓库，但是我看了你的收益率曲线，发现 25 年全年的 alpha 主要集中在前两个月，最后三个月甚至利润回吐都比较明显。我想问问对于这样的情况你怎么处理呢？

xbtlin

Jun 23

@idblife 我用/investment-research 给你跑完了。你在 github 项目 reports 文件夹下搜：微软、google 、SpaceX 就好

xbtlin

Jun 23

@nanyancc 坦白的说，没处理，我坚信价值投资，卖出的条件只有三个：看错了、极度高估、有更便宜的优秀标的

maxwellz

Jun 23

是不是还是得有比较靠谱的数据源效果才会比较好哦，纯靠 AI 收集网络的信息，效果也还行吗？

xbtlin

Jun 23

@maxwellz 信源可靠性刚开始很困扰我，所以我用了多源验证的 skill ，以及调用工具验证，能解决很大问题。

zhouxu

Jun 23

非常棒的项目

Chichele

Jun 23

挺合理，相当于起到研究员的作用，收益本质还是靠自己的判断

Chichele

Jun 23

我最近是通过一段话，利用 gemini 的 deep search 按谨慎、中性、积极三个角度来给出目标价，然后我自己做了个网页来跟踪股票的目标价和实时价的偏移，再自己判断下手

body007

Jun 23

好项目，必须要点赞支持啊。

wpl

Jun 23

楼主帮忙跑下美股的 GEV

actopas

Jun 23

LLM 做投资研究最大的风险其实就是会快速触达个人认知的上限，最终因为人性的懒惰一切都变得盲目又浮躁了

digitv

Jun 23

@xbtlin 可以搞个微信群大家一起交流么

digitv

Jun 23

如果分析的是美股，搜集的股票数据是从哪里采集的？之前用过一些 agent ，都是搜国内网站的居多，感觉质量不高

weilaa

Jun 23

不太会用 claude

jjtang11

Jun 23

拿来做投研不错，不过跑了下小米，财报只能拿到 2024 年的，这些工具主要还是受限于数据来源啊，如果可以让用户配置来源，可以加入用户自己的付费渠道就更好了

Kakarrot

Jun 23

楼主牛逼抽时间研究研究能不能在 codex 上跑

v21984

Jun 23

只有“news-pulse”这个写了 name 和 description 的技能，可以被 OpenCode 工具正确识别

xiaojizhuodami

Jun 23

楼主这两年仓位都在半导体吗？

Huxley42

Jun 23

看起来不错，实战不知道效果怎样

hailaz

Jun 23

你跑下小米 HK 看看，恒生科技下跌了半年

xbtlin

Jun 23

@digitv

godmiracle

Jun 23

中国联通为什么被排除啊

xbtlin

Jun 23

@digitv 谢谢你的建议，暂时不搞群，精力有限先把项目做好。有问题直接在 GitHub 开 issue ，讨论质量比群聊高，而且沉淀下来后来的人也能看到。

Zeyes

Jun 23

好东西，今晚研究一下。
帮跑一下，A 股洛阳钼业 603993

Haller

Jun 23

用 AI 最大的风险点是你信不信任的问题

shuqin2333

Jun 23

有没有技术分析的，什么压力位、缠论之类的

xbtlin

Jun 23

@digitv 会调用 WebSearch 、Fetch 的工具获取，有时候是可以拿到官网数据的，我看国外网站还是蛮多的。

mywjyw

Jun 23

考不考虑把最近那个白毛股神的 skill 加进来

Colderer

Jun 23

@xbtlin 帮忙跑下康方生物，谢谢~

mankismi

Jun 23

能知道大概會消耗多少 token 嗎？

xbtlin

Jun 23

评论区提到的股票我都看到了，在陆续跑，跑完一个贴一个，别急。

javazero

Jun 23

max 20x 跑一次大概需要多少周限额呢？

xbtlin

Jun 23

@wpl 一句话总结：GE Vernova 是一家好公司——但在 Forward PE 61x 的价位，好公司不等于好投资。等一个大幅回调再考虑。完整报告： https://github.com/xbtlin/ai-berkshire/blob/main/reports/GE%20Vernova/GEV-research-20260623.md

MasterC

Jun 23

m ，学习一下

fangqiu1992

Jun 23

---
⚠️ 一处需你确认：标准 report_audit.py 准出流程依赖二级市场公开数据源，对未上市公司不适用，我改用"逐点标注置信度"替代，并在附录如实说明了——这是对规范的合理偏离，特此告知。

Gyj123

Jun 23

@xbtlin 哥，帮跑下德业股份&川润股份，感谢🙏

jimrok

Jun 23

看到这种收益率，应该回撤也不小。

justfindu

Jun 23

这个环境下这种应该不能算为标准参考线吧.

xiangran0028

Jun 23

这种多 gent 的投资框架现在挺多，OP 有做过对比吗？比如优势和差异点在哪？

xbtlin

Jun 23

@Zeyes https://github.com/xbtlin/ai-berkshire/blob/main/reports/%E6%B4%9B%E9%98%B3%E9%92%BC%E4%B8%9A/%E6%B4%9B%E9%98%B3%E9%92%BC%E4%B8%9A-research-20260623.md

alalida

Jun 23 via Android

https://www.1point3acres.com/bbs/thread-1152089-1-1.html
[学习资料] 前几天用谷歌的 Gemini-cli 给家属做了个 Vibe trading 投研分析系统，很神 🐮

我记得去年就有人用 gemini-cli 加上 plusefin 和雅虎金融搭建了。好像效果和你这个差不多？

xbtlin

Jun 23

@hailaz 小米： https://github.com/xbtlin/ai-berkshire/blob/main/reports/%E5%B0%8F%E7%B1%B3/%E5%B0%8F%E7%B1%B3-%E5%9B%9B%E5%A4%A7%E5%B8%88%E7%BB%BC%E5%90%88%E5%88%86%E6%9E%90-20260623.md

xbtlin

Jun 23

@Colderer 康方生物： https://github.com/xbtlin/ai-berkshire/blob/main/reports/%E5%BA%B7%E6%96%B9%E7%94%9F%E7%89%A9/%E5%BA%B7%E6%96%B9%E7%94%9F%E7%89%A9-%E6%8A%95%E8%B5%84%E7%A0%94%E7%A9%B6%E6%8A%A5%E5%91%8A-20260623.md