V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yuanfnadi
V2EX  ›  程序员

kindle 追起点文有何好方法?

  •  
  •   yuanfnadi · 2017-09-30 15:17:41 +08:00 · 9483 次点击
    这是一个创建于 2609 天前的主题,其中的信息可能已经有所发展或是发生改变。

    是否有爬虫可以爬起点、纵横的文章。就是相当于我配好书籍名字和自己账户,就会定时轮训章节的更新。 然后把文字趴下来发到自己 kindle 上。

    23 条回复    2017-09-30 20:29:59 +08:00
    greatghoul
        1
    greatghoul  
       2017-09-30 15:24:33 +08:00 via Android
    这个有意思
    lifeintools
        2
    lifeintools  
       2017-09-30 15:28:07 +08:00
    可以啊。。技术上可以实现 自己写一个呗
    MontagePa
        3
    MontagePa  
       2017-09-30 15:29:07 +08:00
    发送文章好说,主要是起点的稿子都是加密的。
    yueyueniao89
        4
    yueyueniao89  
       2017-09-30 16:00:58 +08:00 via Android
    刷安卓
    vankid
        5
    vankid  
       2017-09-30 16:20:11 +08:00
    自己写,然后解码
    jadec0der
        6
    jadec0der  
       2017-09-30 16:21:00 +08:00
    多看里有一些网文吧,就是有点贵
    izoabr
        7
    izoabr  
       2017-09-30 16:22:27 +08:00
    曾经想过,支持微信订阅号之类的网页文章,转成 PDF,自动发送到 kindle 邮箱。
    zjl03505
        8
    zjl03505  
       2017-09-30 16:26:30 +08:00
    爬下来后还是需要付费再阅读的
    yuanfnadi
        9
    yuanfnadi  
    OP
       2017-09-30 16:31:09 +08:00
    @zjl03505 付费没问题,只是想在 kindle 上看罢了。
    vainl1
        10
    vainl1  
       2017-09-30 17:24:59 +08:00
    写个脚本定时爬,爬完之后发到 kindle 文档服务邮箱,然后就可以看了。
    参见:
    Kindle 个人文档服务: https://www.amazon.cn/gp/help/customer/display.html/?nodeId=200767340
    使用您的〖发送至 Kindle 〗电子邮箱: https://www.amazon.cn/gp/help/customer/display.html?nodeId=201974220
    keenwon
        11
    keenwon  
       2017-09-30 17:41:49 +08:00
    kindle 格式是个麻烦的问题,txt,pdf 支持的都不算好
    yuanfnadi
        12
    yuanfnadi  
    OP
       2017-09-30 17:48:21 +08:00
    @vainl1 发邮件我也知道。只是想问一下有没有人建好轮子
    Trim21
        13
    Trim21  
       2017-09-30 17:51:06 +08:00
    @yuanfnadi 我能想到的最快捷的办法是建一个 KindleEar,然后自己把爬来的文章转成 rss,让 KindleEar 处理转成数据和发送到 kindle 的工作
    ifaii
        14
    ifaii  
       2017-09-30 17:54:49 +08:00
    我自己写过一个 抓取过滤发送到 kindle 一气呵成的爬虫,但因为水平不够,起点是 VIP 部分需要登录搞不定,只能爬到免费部分
    8811
        15
    8811  
       2017-09-30 18:04:38 +08:00
    从数据安全的角度,起点的 vip 内容,肯定很难输出
    Abirdcfly
        16
    Abirdcfly  
       2017-09-30 18:16:31 +08:00
    从支持正版的角度,我支持用付费用户爬起点的正版内容自己看。
    从技术实现,估计爬盗版小网站或者对应贴吧的连载贴容易点😂
    a1044634486
        17
    a1044634486  
       2017-09-30 18:16:42 +08:00
    vip 的直接掏钱啊,楼主又没说免费看
    yuanfnadi
        18
    yuanfnadi  
    OP
       2017-09-30 18:25:38 +08:00
    @8811 可以输出。我刚才试了一下


    const getContent = async (pageUrl) => {
    console.log("开始爬取起点的网页%s",pageUrl)
    const page = await browser.newPage();
    await page.goto(pageUrl);
    var atricle = await page.evaluate(() => {
    var article = document.querySelector("#chapterContent > section")
    return article.innerText
    });
    await page.close()
    return atricle
    }
    module.exports = {getContent};


    目前正在写。
    Hzzone
        19
    Hzzone  
       2017-09-30 18:33:40 +08:00 via iPhone
    https://github.com/Hzzone/kindle-zhuishu
    我以前想过写一个类似功能的脚本,调用追求神器 API,然后通过信任邮箱发送到 kindle 上。但是问题是只能说一章一章推,不能像手机一样有目录。
    时间比较少,有了思路然后跨了半步,后面就弃了,希望贴主能做一个轮子出来,造福所有喜欢读小说的。
    dong3580
        20
    dong3580  
       2017-09-30 18:50:57 +08:00 via Android
    dianxin
        21
    dianxin  
       2017-09-30 18:54:01 +08:00
    体验版浏览器,打开文章模式看就行了
    qian19876025
        22
    qian19876025  
       2017-09-30 19:22:50 +08:00
    我去你们的正版思维呢?
    Miy4mori
        23
    Miy4mori  
       2017-09-30 20:29:59 +08:00 via iPhone
    @qian19876025 你看贴了吗,人家说了付费。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3754 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 04:15 · PVG 12:15 · LAX 20:15 · JFK 23:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.