V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
爱意满满的作品展示区。
wlwr

写了个 RSS 小工具,提供微信公众号 RSS 订阅接口

  •  5
     
  •   wlwr · Apr 27, 2015 · 17384 views
    This topic created in 4019 days ago, the information mentioned may be changed or developed.

    之前用V2网友提供的微信公众号RSS接口,但最近挂掉了。。索性自己写个小程序,便于维护

    地址: http://rss.wlwr.net

    基于Node.js koajs开发

    Supplement 1  ·  Apr 28, 2015
    欢迎 Star:https://github.com/wlwr/rss
    58 replies    2018-06-13 13:43:14 +08:00
    missqso
        1
    missqso  
       Apr 27, 2015
    谢谢
    alsacegustav
        2
    alsacegustav  
       Apr 28, 2015
    好用,文字、图片、格式抓取过来都正常,希望能长期使用,加油
    wlwr
        3
    wlwr  
    OP
       Apr 28, 2015
    @alsacegustav 会长期维护,谢谢支持哈
    wizos
        4
    wizos  
       Apr 28, 2015
    用inoreader时,抓取的内容会直接显示标签……
    m3ng9i
        5
    m3ng9i  
       Apr 28, 2015
    不错。另外有一些符号,比如英文圆括号能不能不要编码成 ( 和 ) 啊?
    m3ng9i
        6
    m3ng9i  
       Apr 28, 2015
    这个地址报错:Internal Server Error
    http://rss.wlwr.net/weixin/oIWsFt_fzFTmSWJ96bXXqFX0yHIQ
    ccbikai
        7
    ccbikai  
    PRO
       Apr 28, 2015
    搜狗有反爬虫,你做处理了吗?
    XnEnokq9vkvVq4
        8
    XnEnokq9vkvVq4  
       Apr 28, 2015   ❤️ 1
    用 inoreader 看时,有些会显示代码。。
    siriusVtoEX
        9
    siriusVtoEX  
       Apr 28, 2015
    @wizos 同样的问题
    wlwr
        10
    wlwr  
    OP
       Apr 28, 2015
    @m3ng9i 刚才 Internal Server Error 的问题处理了
    Winny
        11
    Winny  
       Apr 28, 2015
    太赞了 感谢 @wlwr
    wlwr
        12
    wlwr  
    OP
       Apr 28, 2015
    @ccbikai 现在接口请求量还少,还没做反爬虫处理。。等后面采集频繁,搞一些代理IP做爬虫代理。
    wlwr
        13
    wlwr  
    OP
       Apr 28, 2015
    @wizos @hanqian inoreader的问题,晚上我装个看看。。我用Reeder看是没问题的
    ccbikai
        14
    ccbikai  
    PRO
       Apr 28, 2015
    @ccbikai 不只是 IP ,还有 cookies ,有人 做过 http://bozpy.sinaapp.com/blog/24
    mrjoel
        15
    mrjoel  
       Apr 29, 2015
    额 仔细看了下 是订阅公众号内容。。
    wizos
        16
    wizos  
       May 1, 2015
    好像没用了……
    wlwr
        17
    wlwr  
    OP
       May 1, 2015
    @wizos 恢复了
    mytion
        18
    mytion  
       May 2, 2015
    不错,已经收藏使用,希望长期保持。加油
    m3ng9i
        19
    m3ng9i  
       May 5, 2015
    @wlwr 采集异常,无法获取数据
    wlwr
        20
    wlwr  
    OP
       May 5, 2015
    @m3ng9i 已恢复。
    m3ng9i
        21
    m3ng9i  
       May 5, 2015
    @wlwx 多谢
    zangbob
        22
    zangbob  
       May 5, 2015
    @wlwr 感谢楼主的作品,希望能长期运行。

    PS:貌似html代码过滤不干净。。。比如这个: http://rss.wlwr.net/weixin/oIWsFt2w7J2ciAdD722lQRr6_Tec
    wlwr
        23
    wlwr  
    OP
       May 6, 2015
    @zangbob html是不做过滤的,尽量保留公众号的文章格式。。强制过滤会导致排版很乱。
    xcz
        24
    xcz  
       May 18, 2015 via Android
    这个不做过滤在inoreader里面看见的真的很纠结啊,别的没有测试,楼主用什么RSS阅读器?
    wlwr
        25
    wlwr  
    OP
       May 19, 2015
    @xcz 我用 Reeder
    berry10086
        26
    berry10086  
       May 20, 2015
    楼主是抓取搜狗的gzhjs这个地址吗
    berry10086
        27
    berry10086  
       May 20, 2015
    现在好像又是数据采集异常
    wizos
        28
    wizos  
       May 22, 2015
    换用http://weirss.me/吧
    wlwr
        29
    wlwr  
    OP
       May 23, 2015   ❤️ 1
    @berry10086 是的,搜狗接口做了加密处理,导致采集失败。问题已修复,可以正常使用了。
    berry10086
        30
    berry10086  
       May 23, 2015
    @wlwr 我也试着写了一个,http://weirss.me,抓取是直接用selenium + phantomjs,解析js渲染后的html,不用考虑cookies和接口变化。但是问题是抓取速度太慢,有时会超时
    berry10086
        31
    berry10086  
       May 23, 2015
    @wlwr 你的网站抓取非常快
    wlwr
        32
    wlwr  
    OP
       May 23, 2015
    @berry10086 当时也有考虑过phantomjs,但等待请求的资源过多,还是选择直接调接口。不过维护成本高些。
    SolLo
        33
    SolLo  
    PRO
       May 25, 2015
    只能是订阅号嘛?不知为何搜狗搜不到我想找的服务号啊
    Williamzhang515
        34
    Williamzhang515  
       May 25, 2015
    题图似乎无法显示啊
    wlwr
        35
    wlwr  
    OP
       May 25, 2015
    @somkanel 搜狗只提供订阅号的数据检索
    wlwr
        36
    wlwr  
    OP
       May 25, 2015
    @Williamzhang515 文章封面图的问题修复了,后面订阅的文章会显示封面图
    libraor
        37
    libraor  
       May 26, 2015
    @wlwr 采集异常,无法获取数据
    libraor
        38
    libraor  
       May 26, 2015
    @wizos 貌似被我玩坏了么。。加进去的都没显示。。
    sinosure
        39
    sinosure  
       May 27, 2015
    @wlwr 奇怪,开始能跑,但运行一段时间后就再也不能跑了,始终报错

    listening on port 3000
    <-- GET /
    <-- GET /
    --> GET / 200 337ms -
    --> GET / 200 352ms -
    <-- GET /weixin/oIWsFt0GzJ9B8He5MfCo4DpkeYBg
    <-- GET /favicon.ico
    --> GET /favicon.ico 404 12ms -
    [SyntaxError: Unexpected end of input]
    --> GET /weixin/oIWsFt0GzJ9B8He5MfCo4DpkeYBg 200 3,074ms -
    wlwr
        40
    wlwr  
    OP
       May 27, 2015
    @sinosure 前2天搜狗接口做了加密处理,代码有变更,你从GitHub检出最新的代码就可以了
    vchard
        41
    vchard  
       May 27, 2015
    这个不错,就是有的文章只有标题没有内容。
    gzany
        42
    gzany  
       May 27, 2015
    之前一直在用,很不错!!
    wlwr
        43
    wlwr  
    OP
       May 27, 2015
    @vchard 比如哪篇文章? 我排查下是什么问题
    sinosure
        44
    sinosure  
       May 28, 2015
    @berry10086 看来还是基于网页的最稳定啊,有考虑开源么
    vchard
        46
    vchard  
       May 29, 2015
    无法更新了
    fuckgfw
        47
    fuckgfw  
       May 29, 2015
    采集异常,无法获取数据
    berry10086
        48
    berry10086  
       May 29, 2015
    @sinosure 会开源的,但是现在还没有完全做好,还有一些问题
    vchard
        49
    vchard  
       May 29, 2015
    已经很好了。恢复原装就可以,能更新就行!
    cainiao
        50
    cainiao  
       Jun 7, 2015
    又挂了,无法采集了
    wlwr
        51
    wlwr  
    OP
       Jun 7, 2015
    @cainiao 恢复了。搜狗限制了频率,请求量较多会造成不定时抽风。建议取代码 https://github.com/wlwr/rss 自己搭建一个。
    ulic95
        52
    ulic95  
       Jun 18, 2015
    现在又采集异常了
    wlwr
        53
    wlwr  
    OP
       Jun 28, 2015
    @cainiao @ulic95 抱歉,之前有些忙,已恢复正常。
    WenyiJi
        54
    WenyiJi  
       Jul 31, 2015
    请问lz还在更新这个作品吗?网页打不开了
    globetour
        55
    globetour  
       Jul 9, 2016 via Android
    安装后可以正常用,但是两个小问题。
    1 ,系统后台运行一段时间后自动退出了,不知什么原因。
    2 ,这个能绕过搜狗的反爬机制吗?
    globetour
        56
    globetour  
       Jul 9, 2016
    第 3 个问题
    RSS 里好像是取每次群发的第一篇文章,其余的就没有了。
    knightliao
        57
    knightliao  
       Dec 20, 2016
    目前,微读可以持续提供服务哈

    http://100weidu.com
    knightliao
        58
    knightliao  
       Jun 13, 2018
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5358 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 83ms · UTC 03:48 · PVG 11:48 · LAX 20:48 · JFK 23:48
    ♥ Do have faith in what you're doing.