V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yeekal
V2EX  ›  分享发现

微信文章抓取最简单方法, no 依赖, no skill

  •  
  •   yeekal · 3 天前 · 1121 次点击

    一行命令抓取微信公众号文章,无需任何依赖安装,无需任何 skill

    为了绕过微信公众号文章页面的滑块验证码,最有效的方法是伪装成微信手机客户端内置浏览器, 所以只需要让 openclaw 通过 curl 伪装微信手机客户端 User-Agent 即可。

    比如下面是 curl 伪装微信手机客户端 User-Agent 的例子,把下面的链接换成任意你想爬的文章链接,可以在自己电脑上直接试

    curl -sL \
    -H "User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 16_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 MicroMessenger/8.0.34(0x16082222) NetType/WIFI Language/zh_CN" \
    -H "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9" \
    -H "Accept-Language: zh-CN,zh;q=0.9" \
    "<weixin 公众号连接>"
    

    无需任何依赖安装,无需任何 skill ,"通过 curl 伪装微信手机客户端 User-Agent",就这一句话即可

    这个 useragent 是 gemini 编的,可以随便换的哈

    不用谢

    7 条回复    2026-03-28 14:57:42 +08:00
    markmx
        1
    markmx  
       3 天前
    先收藏 回来试试
    znlbwo
        2
    znlbwo  
       2 天前
    亲测有效
    v1
        3
    v1  
       2 天前
    注意限流风控,5 分钟内超过一定次数会增加 js-bridge 来判断
    korvin
        4
    korvin  
       1 天前
    试试这个,干净,就是不知道风险会怎样。

    https://defuddle.md/mp.weixin.qq.com/s/wFHPSbpEwzj2lE5I8LBKgw
    yeekal
        5
    yeekal  
    OP
       1 天前
    @korvin 这个还不错,试了微信公众号和 x 都可以拿到干净的 markdown
    wingbeat
        6
    wingbeat  
       9 小时 59 分钟前
    @korvin

    真的不错
    putaozhenhaochi
        7
    putaozhenhaochi  
       38 分钟前
    有办法从公众号主页抓取文章列表吗
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3010 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 07:36 · PVG 15:36 · LAX 00:36 · JFK 03:36
    ♥ Do have faith in what you're doing.