LINAICAI
V2EX  ›  问与答

如何采集漫画

  •  
  •   LINAICAI · Feb 28, 2014 · 3292 views
    This topic created in 4474 days ago, the information mentioned may be changed or developed.
    说到底就是采集规则,采集漫画和采集图片一样吗。
    5 replies    1970-01-01 08:00:00 +08:00
    kiah
        1
    kiah  
       Feb 28, 2014
    一样的。。
    zhy0216
        2
    zhy0216  
       Feb 28, 2014
    一样的,
    但最好自己写个model, 分好哪本漫画, 哪一卷这些数据,
    然后在页面的model里存图片的url就好
    LINAICAI
        3
    LINAICAI  
    OP
       Feb 28, 2014
    @zhy0216
    是不是读取目标网页html内的特定节点然后记录到相应的model,这样的话,如何做到自动展开二级或者内链读取下级网页数据呢?
    LINAICAI
        4
    LINAICAI  
    OP
       Feb 28, 2014
    @zhy0216 还有是有些分页数据怎么去,不可能每一页都去读取一次吧。
    zhy0216
        5
    zhy0216  
       Mar 20, 2014
    @LINAICAI
    没太看懂你的意思
    就是找到这个漫画, 这个漫画下面有很多卷
    你把这些都存下, 然后再去爬每一个卷,
    看这个卷的时候, 一方面都有下一页的连接, 所以你可以继续爬
    另外一般的漫画站都是把页码数写在url上的, 你可以猜

    不知道讲清楚没。。。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2564 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 01:12 · PVG 09:12 · LAX 18:12 · JFK 21:12
    ♥ Do have faith in what you're doing.