我建了两个网站,没有任何被任何博客添加友链,没有在任何网站上留下过 url ,但是我都在这两个服务器里的 access.log 里看到了谷歌爬虫(虽然我设置了 robots.txt 不让爬取)。难不成是靠遍历 ip 地址吗?
1
xzem 2016 年 11 月 17 日
比如说 chrome
|
2
DesignerSkyline 2016 年 11 月 17 日 via iPad
Google chrome 的安全检测服务可能会导致这个现象
|
3
yankebupt 2016 年 11 月 17 日 via Android
爬的时候不遵循 robots.txt 的也有可能是伪造成谷歌爬虫的其他爬虫,比如安全机构
|
4
yushiro 2016 年 11 月 17 日 via iPhone
网站有域名,根据域名注册商的列表爬。
|
5
syahd OP @DesignerSkyline 什么意思?
|
7
DesignerSkyline 2016 年 11 月 17 日
@whwq2012 safebrowsing probes
|
11
flynaj 2016 年 12 月 15 日 via Android
看 ip 地址,如果不是 google 的服务器就是伪造的,可能是扫描
|