nong99
V2EX  ›  问与答

怎么定义爬虫?很多第三方 APP 爬取论坛内容,那不也是爬虫了吗?

  •  
  •   nong99 · Dec 26, 2024 · 1501 views
    This topic created in 519 days ago, the information mentioned may be changed or developed.

    如题,类似的比如:论坛助手
    我理解就是爬取论坛内容了,而且有的论坛应该没有暴露提供 API 调取数据的。

    那么此间行为不就是属于爬虫了吗?
    这个爬虫的行为怎么定义呢?

    7 replies    2024-12-27 17:13:25 +08:00
    iyaozhen
        1
    iyaozhen  
       Dec 26, 2024
    不好定义,别人告你 也要打过官司才知道

    简单来说除非给钱特别多,不然不做。zf 类的坚决不做,因为没机会讨论定义
    nong99
        2
    nong99  
    OP
       Dec 26, 2024 via iPhone
    @iyaozhen #1 哈哈,zf 类肯定不搞哈。 明白了
    mumbler
        3
    mumbler  
       Dec 26, 2024
    符合 robots 协议就没问题
    jifengg
        4
    jifengg  
       Dec 26, 2024
    我觉得楼主要的不是爬虫的定义,是“非法爬虫”的定义?
    nong99
        5
    nong99  
    OP
       Dec 26, 2024 via iPhone
    @jifengg #4 Yes ,应该就是这个意思了。
    @mumbler #3 好的👌我去了解下🫡
    Hookery
        6
    Hookery  
       Dec 27, 2024
    论坛助手本来就是爬虫,搜索引擎也是爬虫。
    lisxour
        7
    lisxour  
       Dec 27, 2024
    爬虫不是贬义词,使用程序化、自动化等方式采集都可以叫爬虫,这本来就很泛的。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1208 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 17:33 · PVG 01:33 · LAX 10:33 · JFK 13:33
    ♥ Do have faith in what you're doing.