爱意满满的作品展示区。
xbtlin

两年实盘 +135%,聊聊我用 Claude Code 搭的多 Agent 投研框架

  •  
  •   xbtlin · 2h 17m ago · 964 views

    做了个 AI 投研系统,4 个 Agent 互相挑刺,结果比我自己分析靠谱多了


    你直接问 Claude"帮我分析拼多多值不值得买",它会给你一篇"一方面...另一方面..."的平衡文。看起来全面,但没法拿来做决策。

    我想做的系统必须给出明确倾向:一个合理价格区间,当前价位偏高、合理还是偏低,附上置信度。做不到这一点的分析,对决策没有帮助。

    花了一年多,把投研流程拆成了一套多 Agent 对抗系统。项目开源在 GitHub: https://github.com/xbtlin/ai-berkshire

    先看产出

    拿拼多多举例,系统实际跑出来的结论:

    • 商业模式维度:C2M 有壁垒,好生意 → 3.7/5
    • 财务估值维度:扣现金 PE 仅 6.3x → 4.4/5
    • 行业竞争维度(逆向思考):护城河比想象中浅,抖音电商 3 年做到 4 万亿 GMV → 3.5/5
    • 风险评估维度:管理层文化有隐患,10 年后不确定 → 2.0/5

    一个说"真便宜",另一个说"不确定就不买"。这种矛盾不是 bug ,是投资决策的真实状态。

    完整的报告样本放在仓库 reports/ 目录下,有 100+ 份,随便翻。

    核心设计:多 Agent 对抗

    /investment-team 会启动 4 个独立的 Claude Code subagent ,每个从不同分析维度(商业模式 / 财务估值 / 行业竞争 / 风险评估)各自搜索网络、各自交叉验证数据、各自给出结论。这不是把一个 prompt 拆成四段再拼回来——是 4 个"分析师"各自做了完整研究,最后由 Team Lead 综合,并且专门有一轮挑战环节:A 的结论要经受 B 、C 、D 的质疑。

    单个 LLM 容易自我强化——前面说了看好,后面就不自觉找支撑证据。多 Agent 对抗就是为了打破这个倾向。

    最终报告输出分层建议:激进型 / 稳健型 / 保守型各自的仓位和价格区间,加上一个"镜子测试"——5 句话说不清为什么买,就是不该买。

    架构

    架构图

    Skill 层( 16 个入口)— 定义你要做什么研究
        ↓
    Agent 层( 4 Agent 并行)— 各自搜索、独立判断、互相挑战
        ↓
    工具层 — Decimal 精确计算 + 实时检索 + 报告校验
    

    两个工程细节:

    不信 LLM 心算。 LLM 算 PE 能算错小数点,港币人民币单位搞混更是常见。所有财务计算走 Python decimal.Decimal,关键数据至少 2 个独立来源交叉验证。还内置了 Benford 定律检测——用首位数字分布异常发现财务数据可疑的线索。

    多层纠偏。 AI 最危险的不是给错答案,而是给一个看起来很对但经不起推敲的答案。框架里内置了信息丰富度分级、逆向检验(强制思考"这家公司怎么会死")、快速否决清单( 8 条红线一票否决,管理层诚信有问题不管多便宜都直接否决)。

    怎么用

    npm install -g @anthropic-ai/claude-code
    git clone https://github.com/xbtlin/ai-berkshire.git
    cp ai-berkshire/skills/*.md ~/.claude/commands/
    
    /investment-team 腾讯           # 4 Agent 并行深度研究
    /earnings-review 腾讯 2025Q4    # 财报精读
    /quality-screen 茅台, 英伟达     # 快速筛选
    

    实盘记录

    附一下自己用这套流程辅助决策的实盘,仅供参考:

    2024 实盘收益

    2025 实盘收益

    指标 2024 全年 2025 至今
    我的实盘 +69.29% +66.38%
    标普 500 +23.31% +16.39%
    恒生指数 +17.67% +27.77%

    几个注脚:样本量只有两年,统计上说明不了什么;集中持仓 3-5 只,波动极大;买入决策是人做的,系统只负责研究;工具是投资过程中逐步搭建的,不构成因果关系。

    这个帖子不是来说"用 AI 炒股能赚钱"的——收益来自集中持有深度研究过的公司,框架的作用是提高研究效率和分析质量。

    已知局限

    • 跑一次完整分析的 token 消耗不小
    • 买入决策仍然依赖人的判断力,工具不能替代

    最后

    GitHub: https://github.com/xbtlin/ai-berkshire

    MIT License ,没有付费版,没有课程,没有星球。有问题直接开 issue ,我都会回。

    一个我自己还没想清楚的问题:LLM 做投资研究最大的风险是什么?是幻觉?是数据滞后?还是给了你虚假的信心让你加大仓位?欢迎聊聊。

    如果你想看某只股票跑出来什么样,评论区留名字(美股/港股),我挑几个跑一下贴上来。

    28 replies    2026-06-23 12:25:32 +08:00
    Brightt
        1
    Brightt  
       2h 15m ago
    牛逼 有 Codex 版本吗,Claude code 门槛还是有点高了
    DXpro
        2
    DXpro  
       2h 12m ago
    “买入决策仍然依赖人的判断力,工具不能替代”

    这不是扯淡吗?
    xbtlin
        3
    xbtlin  
    OP
       2h 12m ago
    @Brightt 暂时没有 Codex 版本,整套系统基于 Claude Code 的 Skill 和 subagent 机制搭建,不是简单的 prompt 集合,迁移工作量不小。门槛其实还好,npm install -g
    @anthropic-ai/claude-code 一行装完,skills 文件复制到 ~/.claude/commands/ 下就能用,不需要自己搭环境或写代码。
    xbtlin
        4
    xbtlin  
    OP
       2h 10m ago
    @DXpro 哈哈理解你的质疑。系统告诉你拼多多严重低估,但真要把 30% 仓位砸进去的时候手还是会抖——跌了再跌怎么办?拿半年不涨割不割?看清楚和下得了手是两回事。
    lyonll
        5
    lyonll  
       1h 59m ago
    牛逼 比自己瞎买好很多
    EndlessMemory
        6
    EndlessMemory  
       1h 54m ago
    楼主研究这个花了多久
    flowzeta
        7
    flowzeta  
       1h 47m ago   ❤️ 1
    很有启发,但“用 claude code 两年实盘+xx%”,claude code 貌似还没发布够两年吧
    aatrox
        8
    aatrox  
       1h 44m ago
    支持 A 股么
    Inn0Vat10n
        9
    Inn0Vat10n  
       1h 42m ago
    今年至今表现如何?
    idblife
        10
    idblife  
       1h 41m ago
    帮跑一下 GOOGLE ,微软,SPACEX ,多谢
    millken
        11
    millken  
       1h 40m ago
    没看出是实盘啊
    Mirana
        12
    Mirana  
       1h 30m ago
    前面的分析看起来很棒,但是 24 年 25 年大模型和 agent 都还不怎么流行,怎么证明这些收益都是这套系统带来的呢,我看了下我 25 年整年也有 77%的收益
    Fish1024
        13
    Fish1024  
       1h 25m ago
    恭喜楼主挣钱。
    weofuh
        14
    weofuh  
       1h 24m ago
    你是:
    1. 价值投资?价值投机?纯投机?
    2. 长期?中期?短期?
    3. 科创 50 还是 血包股?

    这些都是个人风险偏好的问题,AI 工具没法给你做出决策,真的就只是分析(基本面+少量技术)
    bjfane
        15
    bjfane  
    PRO
       1h 19m ago
    简单来说 当场就 star 了
    xbtlin
        16
    xbtlin  
    OP
       1h 19m ago
    @flowzeta 两年实盘是真实的,这些实践经验通过 Claude Code 形成体系了,就是这个项目
    xbtlin
        17
    xbtlin  
    OP
       1h 17m ago
    @EndlessMemory 研究投资可能有快 10 年了,本身从事 AI 行业,所以酝酿应该挺久的,做这个项目是几个月前
    xbtlin
        18
    xbtlin  
    OP
       1h 16m ago
    @Mirana 理解,准确的说我是现有投资框架,然后通过 Claude Code 把这个套投资框架沉淀成这个项目。我自己现在还在用这个项目,反正几乎所有的研究都会上传到这个项目
    digitv
        19
    digitv  
       1h 16m ago
    你这是先知道什么股票再去分析的吧?如何决策买点和卖点呢?另外支持使用国产的模型分析不
    xbtlin
        20
    xbtlin  
    OP
       1h 15m ago
    @aatrox 支持的,report 里面有 A 股的公司的
    xbtlin
        21
    xbtlin  
    OP
       1h 15m ago
    @idblife 好,我给你跑一下
    xbtlin
        22
    xbtlin  
    OP
       1h 8m ago
    @digitv 也有产业分析的,比如用/industry-research 半导体,支持国产模型的,claude code 的框架+国产模型没问题
    xbtlin
        23
    xbtlin  
    OP
       1h 5m ago
    “如果你想看某只股票跑出来什么样,评论区留名字(美股/港股),我挑几个跑一下贴上来。”

    增加下:支持 A 股,支持 A 股
    nanyancc
        24
    nanyancc  
       1h 0m ago
    我没有详细看你的 GitHub 仓库,但是我看了你的收益率曲线,发现 25 年全年的 alpha 主要集中在前两个月,最后三个月甚至利润回吐都比较明显。我想问问对于这样的情况你怎么处理呢?
    xbtlin
        25
    xbtlin  
    OP
       48 mins ago
    @idblife 我用/investment-research 给你跑完了。你在 github 项目 reports 文件夹下搜:微软、google 、SpaceX 就好
    xbtlin
        26
    xbtlin  
    OP
       47 mins ago
    @nanyancc 坦白的说,没处理,我坚信价值投资,卖出的条件只有三个:看错了、极度高估、有更便宜的优秀标的
    maxwellz
        27
    maxwellz  
       46 mins ago
    是不是还是得有比较靠谱的数据源效果才会比较好哦,纯靠 AI 收集网络的信息,效果也还行吗?
    xbtlin
        28
    xbtlin  
    OP
       44 mins ago
    @maxwellz 信源可靠性刚开始很困扰我,所以我用了多源验证的 skill ,以及调用工具验证,能解决很大问题。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3914 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 96ms · UTC 05:09 · PVG 13:09 · LAX 22:09 · JFK 01:09
    ♥ Do have faith in what you're doing.