本小菜最近在做一个爬虫抓数据,遇到个问题,请教各位大佬。
在使用 selenium 与谷歌浏览器抓取数据时,在正常模式下程序是没问题的,但是在 headless 模式下,由于没有 handle,所以会识别不了哪个 tab 页面,比较苦恼。好几天了也没有解决,网上也找不到相关解决办法。
程序基本流程就是:
页面 1:selenium 自动 输入用户名、密码,登陆成功。然后点击页面内的一个图标链接,此时会跳一个新的页面(页面 2 )。
页面 2:页面 2 打开后,点击其中某个链接,会再跳出一个新的页面(页面 3 )。
页面 3:抓取页面 3 中的相关内容。
现在的问题:
这些新的 tab 页面,页面 2、页面 3 在 headless 模式下怎么定位到,求救!
在使用 selenium 与谷歌浏览器抓取数据时,在正常模式下程序是没问题的,但是在 headless 模式下,由于没有 handle,所以会识别不了哪个 tab 页面,比较苦恼。好几天了也没有解决,网上也找不到相关解决办法。
程序基本流程就是:
页面 1:selenium 自动 输入用户名、密码,登陆成功。然后点击页面内的一个图标链接,此时会跳一个新的页面(页面 2 )。
页面 2:页面 2 打开后,点击其中某个链接,会再跳出一个新的页面(页面 3 )。
页面 3:抓取页面 3 中的相关内容。
现在的问题:
这些新的 tab 页面,页面 2、页面 3 在 headless 模式下怎么定位到,求救!