V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
patz
V2EX  ›  外包

爬虫究竟是合法还是违法的?爬虫的法律红线到底在哪里呢?

  •  
  •   patz · 2020-09-11 12:41:14 +08:00 · 951 次点击
    这是一个创建于 1519 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我有 5 年多的软件开发经验,是一名全栈软件工程师,主要帮助客户开发定制 ERP 、产品管理系统、自动化程序、桌面软件等程序。

    最近在谈的外包项目,有几个是爬虫的, 犹豫要不要接,因为最近听说做爬虫有法律风险。我研究了网络安全法,还有咨询了些同行, 说一般只是开发程序,不售卖数据,就没问题? 是这样的么?网络安全法感觉定义很模糊,它强调的用户隐私数据一般我们也爬不了(因为不在公开数据里面),除非 hack 进别人的服务器。


    我现在比较纠结, 因为我在在数据采集和爬虫软件开发方面有丰富经验, 大大小小做过 100 多个项目, 采集过的信息很广, 包括电商数据、企业数据、社交平台数据、招聘数据、和其他互联网数据等,这个市场也很大,不做感觉很可惜。
    14 条回复    2020-09-12 20:05:58 +08:00
    Yc1992
        1
    Yc1992  
       2020-09-11 13:18:50 +08:00
    robots.txt
    fank99
        2
    fank99  
       2020-09-11 14:26:26 +08:00
    按 robots.txt 来什么都别爬了。
    个人认为不碰个人数据、版权数据、基本问题不大。
    去年遭的一大波爬虫公司,都是爬个人信息给小贷做金融风控的。
    v2hh
        3
    v2hh  
       2020-09-11 14:34:08 +08:00
    一个朋友所在的公司爬直播数据的,昨天中午开始联系不上,到晚上了报警说是已经关起来了。
    cao2ji
        4
    cao2ji  
       2020-09-11 15:44:40 +08:00
    这个咋说呢,我这个圈子搞爬虫外挂抢 JD SN TM 还有全国商超的人太多太多,都是明目张胆的打广告,没听说谁被搞过,懂得低调规避。按说应该没啥问题,当然理论上是有法律风险的
    wysnylc
        5
    wysnylc  
       2020-09-11 16:13:27 +08:00
    去别人家门口捡垃圾可以,去别人家里捡垃圾就不行
    wandehul
        6
    wandehul  
       2020-09-11 16:28:55 +08:00
    涉及个人信息的,肯定不可以,公开的可怕,例如什么什么裁判文书之类的额。
    overthemoon
        7
    overthemoon  
       2020-09-11 17:04:21 +08:00
    个人信息,商业信息
    TimeRain
        8
    TimeRain  
       2020-09-11 17:25:12 +08:00
    违法不违法要看对方怎么说,爬取公开数据非用户隐私也有可能违法
    zhiwu
        9
    zhiwu  
       2020-09-11 17:31:40 +08:00
    我记得有一家被抓了,是因为爬的智联招聘的接口都报 500 了,笑死了。你轻点来不行?
    niselover
        10
    niselover  
       2020-09-11 17:38:33 +08:00
    楼主交个朋友 wechat: d2FuZ3NhbnhpYQ==
    patz
        11
    patz  
    OP
       2020-09-11 20:17:18 +08:00
    @niselover 你好,你发的貌似被屏蔽了, 你试试家我 yuandong_zhong
    patz
        12
    patz  
    OP
       2020-09-11 20:18:35 +08:00
    @v2hh 我去,你朋友出来了么? 具体因为什么原因被关? 直播数据也不行?
    winnerczwx
        13
    winnerczwx  
       2020-09-12 10:00:41 +08:00
    @patz 估计反编译了人家 app, 拿到了加密算法, 这就不算公开数据了吧
    v2hh
        14
    v2hh  
       2020-09-12 20:05:58 +08:00
    @patz 被 AL 告了,他们爬的是淘宝直播数据,三天后才能探视
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2703 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 12:55 · PVG 20:55 · LAX 04:55 · JFK 07:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.