V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
i4oolish
V2EX  ›  问与答

为什么 readhub 就可以爬大站,而不吃免费饭?

  •  1
     
  •   i4oolish · Dec 2, 2020 · 1676 views
    This topic created in 1983 days ago, the information mentioned may be changed or developed.
    如题,readhub 数据是爬虫爬的,还是 rss 获取的?有人关注研究过 readhub 的数据来源吗?
    TimePPT
        1
    TimePPT  
    PRO
       Dec 2, 2020
    都有可能,这个除了内部人谁能说得清。
    其实爬虫也好 RSS 获取也好都是灰色地带,有几条红线别碰一般站方不刻意整你都没啥关系。

    1. 别把人站点爬瘫了,造成经营问题
    2. 别无授权全文转载
    3. 别未经用户允许爬取个人隐私数据,特别是别商用。

    对比下 Readhub,你看看哪条触红线了?
    wildnode
        2
    wildnode  
       Dec 2, 2020
    我记得 ReadHub 不是跳转到源站观看吗?
    gesse
        3
    gesse  
       Dec 2, 2020
    readhub 只是个索引,而且本身冯大辉和他公司应该也有相关都公关操作。
    i4oolish
        4
    i4oolish  
    OP
       Dec 2, 2020
    @TimePPT 你说的这几点确实都没有,我比较好奇的是,即使没碰这几条红线,是不是找你的话你也肯定兜不了,还是说,通过其他什么方法规避,可以规避法律漏洞。
    TimePPT
        5
    TimePPT  
    PRO
       Dec 2, 2020 via Android   ❤️ 1
    @i4oolish 如果硬找茬基本上协商解决,要么合作要么赔钱然后停止抓。判例可以看下当年传统媒体和门户跟诉头条的几个 case
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3450 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 11:21 · PVG 19:21 · LAX 04:21 · JFK 07:21
    ♥ Do have faith in what you're doing.