看了一下好像大部分都用Python,也有PHP的,还有现在的爬虫框架成熟吗?那直接调用的话开发应该很快吧?
1
xmbaozi 2015-06-23 18:39:56 +08:00
pyspider
|
2
lonelygo 2015-06-23 18:48:09 +08:00
@fghfjujiber 我貌似也有和楼主一样的想法,问题是,我啥端都没弄过😢。
python看了几天学习了下语法。 git找了个爬虫看了看代码,貌似框架成熟,关键是怎么分布,怎么处理反爬,怎么找免费代理,当然了,分析网页是基本能力。 LZ,一起玩呗(本人基本工作后就没碰过代码,有点汇编的底子)。 |
3
thanksir 2015-06-23 18:58:16 +08:00
python的话可以考虑pyspider、pyquery、scrapy
php可以考虑phpquery 比较而言,python更适合做爬虫 |
4
yytsjq 2015-06-23 18:59:01 +08:00
PHP Simple HTML DOM Parser
|
5
fghfjujiber OP @lonelygo 可以哦!约起!
|
6
fghfjujiber OP 那看来还是python比较适合哦!
|
7
lonelygo 2015-06-24 10:09:58 +08:00
@fghfjujiber 哈,约。
|