proxy_tower
代理负载均衡模块,更高效率的使用代理池
注:proxy_tower 本身不抓取、嗅探代理
特性
- 多倍转发
- 支持将收到的代理请求转发给多个 proxy
- 返回最快并且有效的 response
多倍转发可有效解决免费 /不稳定代理使用率低的问题
- response 校验
- pattern 是目标站点的某个复用页面,通常有同样的 URL 前缀,类似的 HTML 结构,如豆瓣电影
movie.douban.com/subject/ - 通过前缀树存储 pattern 和对应的 xpath 或 keyword 校验规则,高效、简便的解决了多站点校验的问题
- 不同的 pattern 有其各自的代理池
- pattern 是目标站点的某个复用页面,通常有同样的 URL 前缀,类似的 HTML 结构,如豆瓣电影