V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sohoer
V2EX  ›  问与答

国内这么多采集器,造就了大量的垃圾站,国外有没有人用采集器,有没有这种现象?

  •  
  •   sohoer · 2012 年 11 月 23 日 · 9255 次点击
    这是一个创建于 4808 天前的主题,其中的信息可能已经有所发展或是发生改变。
    20 条回复    1970-01-01 08:00:00 +08:00
    l0wkey
        1
    l0wkey  
       2012 年 11 月 23 日
    有。
    sohoer
        2
    sohoer  
    OP
       2012 年 11 月 23 日
    @l0wkey 那你知道有什么采集器吗?我就是不会搜,找不到
    soudesuka
        3
    soudesuka  
       2012 年 11 月 23 日
    外国的普世价值不允许有采集器,没有法律条例约束,这是信仰的力量。
    sohoer
        4
    sohoer  
    OP
       2012 年 11 月 23 日
    @soudesuka 采集器要看在什么人手中对吧,这工具是肯定需要的,
    GOOGLE其实也是靠的采集
    kava
        5
    kava  
       2012 年 11 月 23 日
    国外也有采集的垃圾站。。。。只不过是要少些
    flyingkid
        6
    flyingkid  
       2012 年 11 月 23 日
    看是采集的用途咯。采集还是有很多人写的。
    如果只是写出来copy一个站的,还是比较少的。
    sohoer
        7
    sohoer  
    OP
       2012 年 11 月 23 日
    @flyingkid 我想也是,只是就是找不到国外的采集工具,呵呵
    likai
        8
    likai  
       2012 年 11 月 23 日
    为什么一定要用国外的采集工具?
    国外应该 叫爬虫之类的吧...
    scg16
        9
    scg16  
       2012 年 11 月 23 日
    记的美国有个专门做垃圾站的公司上市了,前年下半年的事。
    Keinez
        10
    Keinez  
       2012 年 11 月 23 日
    @soudesuka 在国外随意转载是要受到追究的,详见各种各样的协议诸如CC/GNU/GPL……这和普世价值和信仰什么无关。君不见香港的外国人一到内地就开始随地乱扔垃圾?
    ilovehoo
        11
    ilovehoo  
       2012 年 11 月 23 日
    @scg16 Demand Media, Inc.~ (NYSE:DMD)
    Mr01
        12
    Mr01  
       2012 年 11 月 23 日
    手法不同 国外有专门的机器人软件卖
    lentrody
        13
    lentrody  
       2012 年 11 月 23 日
    gelbooru.com 纯拷贝danbooru
    不过貌似现在是和 danbooru.donmai.us 共享图库……
    armoni
        14
    armoni  
       2012 年 11 月 23 日
    国外采集站也不少,只是google反垃圾比百度迅猛,导致垃圾站流量减少,数量日渐消退
    Ultratude
        15
    Ultratude  
       2012 年 11 月 24 日
    @sohoer 做垃圾站的印度哥不要太多。
    Semidio
        16
    Semidio  
       2012 年 11 月 24 日
    这个我怎么记得国外有好多专门的软件弄的,还是收费的,可以订阅多个RSS,读取其内容后,使用同义词替换的方法来避免Google的惩罚。比如这家: http://wprobot.net/ 还有这家 http://wpturbo.com/ ,搜索Autobloging或者auto posting能出来好多。
    maddot
        17
    maddot  
       2012 年 11 月 24 日
    以前做英文博客,被一个中国佬每篇自动采集到goole家的blogspot上,还总排名在我之前。
    Mutoo
        18
    Mutoo  
       2012 年 11 月 24 日
    前阵子不是还有新闻说国外一个19岁的小伙子做了一个自动摘要的IT信息网站,人家同样是采集,但是信息处理得非常棒呐。
    nonozone
        19
    nonozone  
       2012 年 11 月 24 日   ❤️ 1
    都说中文文章一大抄,在我的使用经验来看,平时搜索各种教程,英文copy程度一点都不必中文弱,搜来搜去都是一样的,也是一大堆牛头不对马嘴东西。当然搜索英文的好处是,很多排名比较靠前的网站相对比较严谨一些。而中文排名靠前的往往是各种博客(还不是独立博客,而是各种门户站博客),以及各种技术门户(这些技术门户本身就挺良莠不齐的),并且牛逼的SEO的软件(垃圾评论,采集,自动博客,包括各种验证码破解)不都是国外的。
    keven
        20
    keven  
       2014 年 3 月 23 日
    采集器是工具,如果用来作垃圾内容转载,抄袭,伪原创,仿站这些用途就造成了各种垃圾,这种一方面是用的人的问题,另一方面也是大量采集器提供者以此为赢利点,或者以此为主要功能设计目标,做出来的工具就只能干这个。
    其实采集器也有做得好的,比如八爪鱼采集器,就不带任何伪原创,一键转帖,自动发布站群等等这些垃圾内容制造的功能,相反,一直提倡的是用采集器来做大数据收集,原始素材整理,以便节省重复性的人力劳动,采集有价值的内容,并且对采集到的数据做深加工,以此来提炼价值。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1055 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 18:50 · PVG 02:50 · LAX 10:50 · JFK 13:50
    ♥ Do have faith in what you're doing.