V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
briefcopy
V2EX  ›  编程

开发网络爬虫应该怎样选择爬虫框架?

  •  
  •   briefcopy · Dec 24, 2014 · 4892 views
    This topic created in 4141 days ago, the information mentioned may be changed or developed.

    看很多开发爬虫的都在纠结怎么选择爬虫框架,弄了个博文,就当在扯淡了。
    http://blog.csdn.net/ajaxhu/article/details/42122461

    2 replies    2018-03-26 15:23:40 +08:00
    foresightyj
        1
    foresightyj  
       Oct 16, 2015
    写得不错。是原创?

    我最了解的是 scrapy ,但是在 windows 下面使用遇到了不少坑(主要是改成使用 FIFODiskQueue 之后,也就是使用持久化的 BFS 而非默认的内存 DFS )。前几天学习了一下 nutch ,只是试了一下命令行,还没有深入到二次开发。
    cangbaotu
        2
    cangbaotu  
       Mar 26, 2018
    推荐你试试神箭手云爬虫( http://www.shenjian.io/) 最近很火的一个爬虫开发平台 在线用脚本开发爬虫
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5810 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 03:37 · PVG 11:37 · LAX 20:37 · JFK 23:37
    ♥ Do have faith in what you're doing.