V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
Junyiz
V2EX  ›  Node.js

抓取新浪博客的命令行程序: dature

  •  
  •   Junyiz · Mar 21, 2018 · 5158 views
    This topic created in 2961 days ago, the information mentioned may be changed or developed.

    dature 是基于 Node.js 的爬虫程序,可以抓取新浪博客某博主的全部博文,包含标题、正文、时间、分类、图片,并生成 HTML 文件。

    安装

    npm install -g dature

    使用

    dature sina_blog_uid

    详见: https://www.npmjs.com/package/dature

    6 replies    2018-03-28 13:06:17 +08:00
    JohnChiu
        1
    JohnChiu  
       Mar 21, 2018 via iPhone   ❤️ 1
    赞!顶一下支持~
    Junyiz
        2
    Junyiz  
    OP
       Mar 22, 2018
    今天更新了生成 HTML 的模版
    xuyl
        3
    xuyl  
       Mar 27, 2018
    试用了下,生产的模板有问题,Cannot read property 'title' of undefined,
    xuyl
        4
    xuyl  
       Mar 27, 2018
    新浪博客?还以为是微博。。。
    Junyiz
        5
    Junyiz  
    OP
       Mar 27, 2018
    @xuyl 对的
    Junyiz
        6
    Junyiz  
    OP
       Mar 28, 2018
    已支持抓取 CSDN 博客
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5407 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 59ms · UTC 07:47 · PVG 15:47 · LAX 00:47 · JFK 03:47
    ♥ Do have faith in what you're doing.