V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
voidtools
V2EX  ›  问与答

求现成方案 [批量提取 douban book 某 tag 所有书的名字] ,然后再去 v1248,再自动化下载对应 book 的 epub 或 txt 格式,用讯飞引擎播读,地铁里闭目聆听, 所以是不能是很硬的书:)

  •  
  •   voidtools · 2017-02-03 04:04:12 +08:00 · 1298 次点击
    这是一个创建于 2850 天前的主题,其中的信息可能已经有所发展或是发生改变。
    这类爬虫应该很简单,但是有妹有 编译好的工具啊? 直接填 tag 名字,咔咔导出书单 list 。
    然后配合 jdownloader 高级脚本, ( https://my.jdownloader.org/index.html)
    去解析 ( http://v1248.com/index.htm?kw=学习正则表达式) 里有效的 baiduyun 的 link


    希望有高人能研究一蛤。

    比如 这类不硬的书
    [互联网]( https://book.douban.com/tag/互联网)
    [个人管理]( https://book.douban.com/tag/个人管理)
    [科技]( https://book.douban.com/tag/科技)

    Ps : it 、不硬的编程、网络攻防、自我管理方面的 epub , txt 很少的(不过千),因为义务 ocr 校对几乎不可能


    欢迎留言推荐 [软] 书,我可以用 abbyy 来 ocr 为 epub 、 txt 或者双层 pdf (我并不校对,有的书不校对也妹关系)
    voidtools
        1
    voidtools  
    OP
       2017-02-03 04:27:25 +08:00
    分享一条找书的搜索引擎参数
    用 firefox 的 addon : add to searchbar 添加
    [q="{searchTerms}*.epub" OR "{searchTerms}*.txt" OR "{searchTerms}*.pdf"]
    ![Clipboard_20170202.png]( https://ooo.0o0.ooo/2017/02/03/5893961fcc3ea.png)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1822 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 16:31 · PVG 00:31 · LAX 08:31 · JFK 11:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.