V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
miniwade514
V2EX  ›  分享发现

这家网站的每篇文章都有一个子域名

  •  
  •   miniwade514 · 2014-02-06 12:33:53 +08:00 · 3345 次点击
    这是一个创建于 3943 天前的主题,其中的信息可能已经有所发展或是发生改变。
    首页 http://blog.ciytan.com/

    里面的一篇文章 http://mtpdhpgc.ciytan.com/

    仔细看了下,文章都是文不对题的,这是不是传说中的垃圾站?

    一篇文章一个域名,他是人工完成的么?
    7 条回复    1970-01-01 08:00:00 +08:00
    ETiV
        1
    ETiV  
       2014-02-06 12:35:58 +08:00 via iPhone
    泛域名解析
    binux
        2
    binux  
       2014-02-06 13:03:08 +08:00
    爬虫的大部分规则是根据域名做的,通过泛域可以绕过这些规则
    dingyaguang117
        3
    dingyaguang117  
       2014-02-06 15:42:18 +08:00
    @binux 他这样的让爬虫认为是不同的site,好处是?
    loading
        4
    loading  
       2014-02-06 15:44:36 +08:00   ❤️ 1
    为了避免ciytan.com被判垃圾站
    binux
        5
    binux  
       2014-02-06 15:48:37 +08:00   ❤️ 1
    @dingyaguang117 比如首页提权,比如单站点收录上限,比如站点抓取配额。不过,对应也会有对应的泛域挖掘策略就是了。
    miniwade514
        6
    miniwade514  
    OP
       2014-02-06 18:26:35 +08:00   ❤️ 1
    @ETiV 然后在服务器上根据URL“重定向”?不知道用词是否准确

    @binux 它的www域名指向一个广告页面,但是文章页上也没有指向WWW域名的链接,他弄这么多页面是不是没什么用啊?

    @loading 原来如此 :D
    msg7086
        7
    msg7086  
       2014-02-08 09:15:01 +08:00
    @miniwade514 不是重定向。就是简单的URL美化。只不过一般是只重塑URI,而这里是重塑二级域名
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1098 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 18:59 · PVG 02:59 · LAX 10:59 · JFK 13:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.