airbasic
V2EX  ›  问与答

weibo.cn 爬虫过频 帐号封多久

  •  
  •   airbasic · Jun 1, 2015 · 5209 views
    This topic created in 4023 days ago, the information mentioned may be changed or developed.

    快一个小时了 所有链接都302到 weibo.cn/pub
    -。-过频
    要封多久,没有帐号好测试了啊

    9 replies    2015-06-02 15:09:41 +08:00
    acfunny
        1
    acfunny  
       Jun 2, 2015 via Android
    说( ̄. ̄) 你在做什么
    airbasic
        2
    airbasic  
    OP
       Jun 2, 2015
    @acfunny 爬了爬微博啊,完全搞不懂它ban的规则
    acfunny
        3
    acfunny  
       Jun 2, 2015 via Android
    只是瞎研究啊 要不物尽其用
    顺带做个输入账户名,列出所有发表过微博的网站。怎么样≥﹏≤
    whywhy36
        4
    whywhy36  
       Jun 2, 2015 via Android
    买帐号啊,我记得不贵的,买个几千个账号,上代理,优化下逻辑,抓数据挺快的
    des
        5
    des  
       Jun 2, 2015 via Android
    微博不是用来发广告的吗?有什么好爬的?
    GPU
        6
    GPU  
       Jun 2, 2015
    @des 现在的微博已经小了很多广告。
    des
        7
    des  
       Jun 2, 2015 via Android
    @GPU 在我印象中微博是一个广告和新闻聚集地。
    况且还有恶心的关键词审查,比如“蜡烛‘’
    582033
        8
    582033  
       Jun 2, 2015 via Android
    记得很久前同一帐号换ip爬是不会被封的,封的时候也就10分钟左右。不知道现在怎么样。
    楼主抓点有效代理来挂上,每几分钟换一个爬爬看。
    airbasic
        9
    airbasic  
    OP
       Jun 2, 2015
    @582033
    @acfunny

    也不是瞎研究,爬相册的,id递增方式一个个爬,抓取所有相册图片
    然后有个很蛋疼的问题,同一个帐号换IP首先会要我输入验证码...这样登录起来就不怎么全自动了
    感觉有点随机封帐号的样子,封了效果就是所有页面302到 weibo.cn/pub
    (我是从weibo.cn这里爬的)
    还有就是sleep(),感觉sleep越久...封的反而越快
    现在加了些干扰的时不时get下某人微博什么的,爬了100+的时候,还是被封..
    而且封的都是好几小时的感觉
    淡淡的忧伤
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2736 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 02:41 · PVG 10:41 · LAX 19:41 · JFK 22:41
    ♥ Do have faith in what you're doing.