前几天写爬虫的时候偷懒,直接用的 selenium。firefox 和 gecokdriver 都是最新版。
跑了一晚上发现 firefox 内存占用从 10%+,到 80%+,最后可能会直接 crash。

浏览器的缓存已经禁用了,甚至尝试使用隐私模式来防止缓存和 cookies。其实目标网页本身不复杂,是个 jsp 页面。
更奇葩的另一个问题是,之前想改用 chrome 试下,结果直接返回空白页。目标网站没有 ssl,然后网上搜了一堆忽略 ssl 安全问题的参数,也都用了。别的 http 页面正常能打开,就目标网站总返回空白,不管在本机还是 vps 上尝试都一样。也很让我困惑。这个和 jsp 页面有关系么?
爬虫现在已经改用 requests 了,但是上面的问题纠结了好久还是不知道原因,求解答下。