起因
刚才看一篇博文,年代有点久远了。文章中不少链接是死链,而且很明显是一些其他的个人博客。其实个人博客是很容易倒下的,同时很多有意义的技术资料都在个人博客上(感觉谷歌搜出来的内容很多都是来自于博客)。
描述
比如我要分享一个连接 https://example.com/123.html,就将其转换成 https://死链存档.com/https://example.com/123.html,同时就缓存这个链接的整个网页,包括一些 css、js、必要的图片。后来人再点击 https://死链存档.com/https://example.com/123.html 的时候如果源站可达就重定向到源站,不可达的话就展示缓存页面。
这样的话插入博客里面的链接就可以长期不管。
博客关站率应该挺高的,就是不知道包含有意义的内容的博客关站程度怎么样。
问题
- 会不会缓存一些奇奇怪怪的东西?
- 可能控制和筛选是有必要的
- 黑历史存储器?
- 源站可以要求删除缓存吧,只要是验证所有权。
- 源站关闭后内容版权问题?
- 我不太了解,望科普一下。既然站都关了,不用太担心吧?
- 不希望被缓存?
- 遵守 robots.txt 吧
- 与互联网档案馆( Internet Archive,https://archive.org )的区别?
- 谁会用 https://archive.org 分享链接。