V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
line
V2EX  ›  问与答

58 同城之类的网站,还有没有办法爬到手机号?

  •  
  •   line · 2015-03-10 13:48:46 +08:00 · 3911 次点击
    这是一个创建于 3546 天前的主题,其中的信息可能已经有所发展或是发生改变。
    想批量采集某一分类下的信息
    10 条回复    2015-03-23 11:39:11 +08:00
    renyuan1985
        1
    renyuan1985  
       2015-03-10 14:00:21 +08:00
    你能看到的都能爬出来,看不到的可能就比较难了
    yakczh
        2
    yakczh  
       2015-03-10 15:02:49 +08:00
    抓图片,再识别就可以,他那个手机号比验证码简单多了
    jiyee
        3
    jiyee  
       2015-03-10 15:05:05 +08:00
    58现在已经是文字了吧,不需要识别了,之前用tesseract做过一个识别58手机号码的简单程序,https://github.com/jiyee/tess58
    learnshare
        4
    learnshare  
       2015-03-10 15:06:27 +08:00   ❤️ 1
    爬站可耻!
    mgc
        5
    mgc  
       2015-03-10 15:14:35 +08:00
    58本身就是爬别人起家的
    isnetit
        6
    isnetit  
       2015-03-10 15:26:02 +08:00 via Android
    @mgc 关键是楼主说的是爬手机号 用户的手机号。不是58的手机号
    line
        7
    line  
    OP
       2015-03-10 15:36:21 +08:00
    手机号要点一下才能看到,而且还是图片。
    colincat
        8
    colincat  
       2015-03-10 15:38:23 +08:00 via iPhone
    有办法,哈哈,我曾经搞定了,现在不知道好用不好用了
    line
        9
    line  
    OP
       2015-03-10 16:09:53 +08:00   ❤️ 1
    @colincat 怎么做的?模拟按键?
    colincat
        10
    colincat  
       2015-03-23 11:39:11 +08:00
    @line 昨天看了一下 58的算法已经变化了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   961 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 84ms · UTC 20:29 · PVG 04:29 · LAX 12:29 · JFK 15:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.