1
imlonghao 2015-02-05 12:16:58 +08:00 via Android
看爬的是什么吧...
如果爬的是他们的内容,那么正常情况下都算是侵权吧 我自己爬过一些站,只爬标题和相关访问量之类的,目前没有遇到什么纠纷 对于一个新网站来说,建议还是不要吧,从0开始才能见证自己网站的成长! |
2
WhyLiam OP |
3
sNullp 2015-02-05 12:34:38 +08:00
爬虫本身不侵权。把爬到的内容作为自己的展示的内容(的一部分)则侵权。
|
6
powtop 2015-02-05 12:48:09 +08:00
默默地问一句 爬虫是啥 怎么写?
|
7
CopyPaste 2015-02-05 12:51:27 +08:00
今日头条是怎么搞定的?
|
8
CopyPaste 2015-02-05 12:52:43 +08:00
是不是除非标明 [严禁转载] 的才算是,其他只要标明源出处就可以了?
|
10
WhyLiam OP |
11
WhyLiam OP |
12
9hills 2015-02-05 13:00:47 +08:00 via iPhone
可叹国内的版权意识,竟然有人说只要他不声明禁止转载就可以随便转载?简直就是强盗
|
15
msg7086 2015-02-05 13:04:45 +08:00 1
@CopyPaste 说反了。
版权法规定,任何作品默认由作者版权所有,拥有一切权利,除非主动声明放弃。 比如说有人在 GitHub 上传了一个自己写的项目,但是没有写任何版权说明。 你把项目下载回来,编译以后发布出去,就属于侵权。 |
16
Stof 2015-02-05 13:05:22 +08:00
|
17
CopyPaste 2015-02-05 13:07:47 +08:00
@msg7086 版权当然归原作者,但是大部分人的文章挂网上,还是希望广泛传播被更多人看到吧?是不是卖给出版商的文章才会在意这些。
|
18
youxiachai 2015-02-05 13:10:03 +08:00
@CopyPaste 今日头条已经被人告了....
|
20
CopyPaste 2015-02-05 13:12:30 +08:00
@youxiachai 之前想过他们怎么这么大胆的做,但回过头想想,他们敢这么做应该做好了相应的对策,或者说法律上又说不清的地方?
|
21
WhyLiam OP |
22
em70 2015-02-05 13:18:04 +08:00
爬虫不侵权,用爬来的数据才可能侵权
|
23
msg7086 2015-02-05 13:19:54 +08:00
|
24
9hills 2015-02-05 13:20:29 +08:00
|
25
9hills 2015-02-05 13:23:11 +08:00
@CopyPaste 既然你不知道,那我明确告诉你,未得到版权人允许的转载,对说的就是你的做法就是侵权。怎么样,得到答案了吧。还不去乖乖删掉侵权文章。
注:版权人允许包括直接授权,根据Licence授权等 |
26
pockry 2015-02-05 13:23:41 +08:00
本来想打一大段话,但想想也说服不了有先入为主的想法的人,干脆不说了,还是用实际行动吧。
我自己写的文章都随便人转的,你们能把它们玩出花来,是你们的本事,如果你能标个来源和署名,那是你素质高,说不定我们还能交个朋友。 |
27
glasslion 2015-02-05 13:28:35 +08:00
@msg7086 这里举GitHub为例有点不恰当。当代码托管在 GitHub, 其版权授权应该满足GitHub 的ToS
https://help.github.com/articles/open-source-licensing/ Generally speaking, the absence of a license means that the default copyright laws apply. This means that you retain all rights to your source code and that nobody else may reproduce, distribute, or create derivative works from your work. This might not be what you intend. Even if this is what you intend, if you publish your source code in a public repository on GitHub, you have accepted the Terms of Service which do allow other GitHub users some rights. Specifically, you allow others to view and fork your repository. |
28
CopyPaste 2015-02-05 13:32:15 +08:00
算了不说了,讨论个事情真费劲,@9hills你哪里看到我转侵权文章了,说的是网站文章的事情,把github拿出来干嘛?github有各种Licence声明好么。
|
29
9hills 2015-02-05 13:38:36 +08:00
@CopyPaste
============= 我去年写了个网站,因为没有什麽信息量,所以爬了2000条数据。这星期接到了对方的信息,让我把爬的数据删了。 ============= 请问你获得对方授权了么?这个不是无授权的转载是什么?你不应该关掉?关掉还BB? |
33
msg7086 2015-02-05 13:42:09 +08:00
|
34
9hills 2015-02-05 13:42:57 +08:00
|
36
9hills 2015-02-05 13:59:21 +08:00 2
@miao 爬虫遵守的是robots协议,这个协议允许爬就能爬。
如果网站没有robots文件,按照Google的解释是不会爬。也是遵循着版权人不允许就不抓取的原则。 另外爬取和展现是两回事,爬取相当于网页本地浏览,展现相当于二次分发。目前搜索引擎的展现仅限于两个:1. 在搜索结果中显示摘要非全文。2. 网页快照 这两个在美国都打过官司,被认为是合理使用,不构成侵权。 |
38
shakoon 2015-02-05 15:04:12 +08:00
@WhyLiam “一個從0開始的網站,沒有信息,沒有索引,沒有收入。很難做吧。”
是不容易,但也并非不可能。我做过的一个网站就是完全白手起家,半年左右才有比较多的访问量,八九个月时就排到搜索引擎第一位了,而我自始至终未采集任何外站数据、未做任何seo。所以说,真心想做网站,是不需要更是不应该去爬什么东西的,搜索巨头们不是傻瓜,那些东西是抄的一目了然。 |
39
peartail 2015-02-05 15:26:56 +08:00
从网站的角度看,爬虫不仅侵权,还浪费了网站的带宽。
我个人觉得有必要通过立法,让robots.txt这种东西不仅仅是一个君子协议,更要有法律效力。 |
40
alexkh 2015-02-05 16:06:22 +08:00
爬虫只是内容采集的方式而已,本身并没有侵权不侵权一说。
是否侵权主要针对网站内容而言,如果是被版权保护的内容被采集了,那肯定是属于侵权了;反之就随便采集了。 如果是版权保护内容,不要说用爬虫采集,就是ctrl+c,ctrl+v手动复制粘贴,也仍然是侵权。 |
41
xuwenmang 2015-02-05 19:02:18 +08:00
微博的分享怎么没人说侵权?
百度/google的搜索引擎怎么没人说侵权? 你发现什么不同了么? |
43
lecher 2015-02-05 22:04:03 +08:00
搜索引擎有协议
爬取内容之后,展现必须保留源站地址,同时积极处理源站所提的版权相关问题。 所以搜索引擎不违规。 微博使用的用户协议就已经注明了,微博平台拥有站内转发用户所发布的文章的权利,当然也还是要保留源地址的。 至于做爬虫爬完全文发布还不保留作者和源地址的,原创方可以提出注明来源、删除的请求,如果发布方不响应这些请求,是违法的,可以提起民事诉讼。 |
44
imlonghao 2015-02-05 22:39:17 +08:00 via Android
问楼上全部,
例如 我爬了v2ex的全部帖子,按照评论数、收藏数等等排序发表在我的网站上,我的网站上仅仅只有帖子的标题以及收藏数,并链接到v2ex的这个帖子。 这样应该不算侵权吧 |
45
a154312237 2015-02-05 22:58:23 +08:00 via iPhone
@imlonghao 我也想知道 只贴出标题 作者 时间 以及原帖地址算侵权么
|