V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
autoname
V2EX  ›  问与答

请教爬虫问题, discuz 论坛的验证老是失败,是什么情况知道的老哥来说说呀

  •  
  •   autoname · Jul 11, 2020 · 1009 views
    This topic created in 2128 days ago, the information mentioned may be changed or developed.

    验证码提取= https://www.discuz.net/misc.php?mod=seccode&action=update&idhash=cS0&0.0423275371233075&modid=undefined

    验证码直链 =https://www.discuz.net/misc.php?mod=seccode&update=49424&idhash=cS0

    第一次请求 去拿 update,

    第二次请求 组合直链,

    我见百度上面都是这样的,写爬虫自动回复的

    但是为啥我老是 验证码错误,真的是奇怪了,cookie 什么的 都和浏览器发的没差,就是验证失败

    每爬一个页面我还都特意的 保存下 cookie 的,

    从登录页,以及帖子页,以及这个提取 update 的 js 页 全部都保存过

    autoname
        1
    autoname  
    OP
       Jul 11, 2020
    人呢
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5398 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 09:04 · PVG 17:04 · LAX 02:04 · JFK 05:04
    ♥ Do have faith in what you're doing.