V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
kenneth
V2EX  ›  程序员

聚合网站如何控制一下外链?

  •  
  •   kenneth · 2013-06-19 14:36:43 +08:00 · 3925 次点击
    这是一个创建于 4176 天前的主题,其中的信息可能已经有所发展或是发生改变。
    聚合网站,有很多来自与站外的图片链接,我既不想保存,但是又不想有出站链接。
    有没有办法将图片全部变成本站链接,但是又不保存图片呢?

    代码正则替换呢?还是js层面替换?爬虫会检测到?

    求思路,求指点。
    zorceta
        1
    zorceta  
       2013-06-19 14:53:40 +08:00   ❤️ 1
    example.com/go/{base64encoded}
    lichao
        2
    lichao  
       2013-06-19 15:56:32 +08:00
    爬虫无视 js,1 楼方法可以
    takwai
        3
    takwai  
       2013-06-19 16:03:04 +08:00
    代码里面替换似乎好一些,不过得加一层代理,替换过的链接经代理读回远程的图片数据再返回给客户端?
    cloudzen
        4
    cloudzen  
       2013-06-19 16:10:49 +08:00
    这样做的目的是什么呢?
    takwai
        5
    takwai  
       2013-06-19 16:12:31 +08:00
    额,不对,犯傻了,代理不需要。

    就如一楼说的那方法,解码得出真实地址后,直接在代码里面来一句 Redirect 到真实地址就好了。
    kaifazhe
        6
    kaifazhe  
       2013-06-19 17:15:14 +08:00
    图片都转base64,html不是会变的超级臃肿,爬虫更不会喜欢
    orzcc
        7
    orzcc  
       2013-06-20 17:12:21 +08:00
    图片地址加密赋值给img的某一个属性xx(非src),用lazy load的原理将xx值解密,然后赋值给src。
    yaotian
        8
    yaotian  
       2013-06-25 17:17:47 +08:00
    @zorceta
    @takwai 如果这种方式,用301, 还是302 Redirect呢?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5683 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 01:41 · PVG 09:41 · LAX 17:41 · JFK 20:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.