V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
xiaoming1992
V2EX  ›  Python

爬虫的法律风险有多大?

  •  1
     
  •   xiaoming1992 · 2019-08-25 23:09:44 +08:00 · 4965 次点击
    这是一个创建于 1908 天前的主题,其中的信息可能已经有所发展或是发生改变。

    把别人网站上的资源爬下来卖给他人商用,卖方和买方负担的法律责任分别是怎么样的?

    11 条回复    2019-08-26 15:47:32 +08:00
    mumbler
        1
    mumbler  
       2019-08-25 23:22:01 +08:00 via Android
    签合同让用数据的人承担全部责任即可,你只是提供技术服务
    xiaoming1992
        2
    xiaoming1992  
    OP
       2019-08-25 23:52:18 +08:00 via Android
    @mumbler 这样的合同能有法律效益吗?
    dazkarieh
        3
    dazkarieh  
       2019-08-26 00:08:21 +08:00
    普通案件亦即大部分是民事不正当竞争案件,得看对方主张的损失金额。17 年,两公司爬了新浪微博部分商业数据用做盈利,连带赔了 220 万; 15 年,某小公司爬了乐视的影视资源,赔了几十万。

    如果通过窃取或者其他方法非法获取公民个人信息等个人信息、商业机密,情节严重(刑九以后 5000 元入罪)则构成侵犯公民个人信息罪,量刑分三年以下和三至七年两档,运气好的缓刑走起,当然民事责任依然是免不了的。如果不幸碰了国家机密,那等着被安全局摩擦吧……

    牵涉民事责任的,根据侵权责任法,行为人与教唆、帮助者承担连带责任,当然内部如何分担赔偿比例你们可以自己提前约定。但是一旦违法涉及刑事责任,那楼上建议的从犯跟主犯签免责条款 /合同是无效的,从犯也是共犯,量刑上有轻重之分而已。
    mumbler
        4
    mumbler  
       2019-08-26 00:24:55 +08:00 via Android
    @xiaoming1992 扒数据并不违法,谷歌百度也扒数据,拿出来商用才违法。只要在合同条款规避了,你提供的是技术服务,不是数据本身,不会连带责任。但甲方跟不跟你签就难说了,不签坚决不干这活
    xiaoming1992
        5
    xiaoming1992  
    OP
       2019-08-26 01:17:17 +08:00 via Android
    @dazkarieh 感谢感谢,没那么严重,就是普通的商业数据😄


    @mumbler 好吧,还是别沾这样的麻烦吧,个人怎么搞的过资本。
    daozhihun
        6
    daozhihun  
       2019-08-26 08:29:25 +08:00
    我觉得你最好不要直接卖原始数据,可以卖加工过的,让人看不出是爬虫。
    现在这种公司好像很多,比如我知道有一家叫“商圈秀”,是针对外卖的,里面就不是卖的原始数据,你看看能不能按照它的套路包装一下。
    Cellei
        7
    Cellei  
       2019-08-26 10:22:41 +08:00
    挺有用,马克一下
    locoz
        8
    locoz  
       2019-08-26 10:41:54 +08:00
    要看是什么样的“资源”,一般的“资源”没啥问题,但是簧色视频这种违禁的就不行。搞之前先确认对方是做什么事情用,明显不太好的事情也别参与,即使合同写了只提供技术服务也不行。
    tomczhen
        9
    tomczhen  
       2019-08-26 11:49:56 +08:00
    违法与否要看相关法律条例,最次也得看之前的判例,结果好几个人上来都是“觉得”。

    很多时候爬虫做的反爬措施——包括突破验证码,逆向加密方法,逆向 App 等都会涉及到刑法条款,严格来说都属于违法行为,但实际需要看最终造成的影响,还有被侵权企业的影响力了。
    xiaoming1992
        10
    xiaoming1992  
    OP
       2019-08-26 12:35:41 +08:00 via Android
    我是搞全景的,市面上 90%的全景(包括 720yun 这种做的比较大的)都是用的同一个框架,稍加处理就能爬下全景图片(虽然都是简单的东西,可是会全景的不会爬虫,会爬虫的不会全景),而全景图片的拍摄成本是比较高的,所以感觉可以搞。可是毫无疑问,这些东西必然有版权,真是撑死胆大的,饿死胆小的。
    dsg001
        11
    dsg001  
       2019-08-26 15:47:32 +08:00
    个人理解,爬取豆瓣电影评论进行商用,这个不行,但爬取豆瓣电影简介,没什么问题
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3537 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 10:33 · PVG 18:33 · LAX 02:33 · JFK 05:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.