自己写的一个爬虫框架哈,第一个版本。请大家轻喷。
不知道为什么提起爬虫很多人第一个想起来的是 Python。其实 PHP 写爬虫也可以写的很好,而且个人感觉并不比前者差啊。而且对于 PHP 作为主语言的人来说,用 PHP 写爬虫也更顺手一些。
特性:
- 极易上手,具备完善的文档和示例
- 支持多并发爬取
- 支持基于 xpath、css 选择器解析内容
- 模拟浏览器行为,如 user-agent、cookie、提交表单
- 支持断点续爬、失败重试、代理、并有完善的爬取日志
- 健壮的底层库,HTTP 客户端基于 guzzle,dom 解析基于 symfony/dom-crawler 库
Github 地址: https://github.com/wyan001/xcrawler
查看文档: https://xcrawler.yanshuju.com/docs/
微信交流群