1
ufo22940268 2013-06-25 18:05:48 +08:00
http://www.crummy.com/software/BeautifulSoup/bs4/doc/
我刚刚用这个做了一个爬虫系统,感觉良好 |
2
lyoe 2013-06-25 18:22:51 +08:00
可以看下这个python的开源爬虫框架 http://scrapy.org/
|
3
xieren58 2013-06-25 20:19:17 +08:00
用node.js啦,异步,处理html可以用jquery。~~~~~~
|
5
gullon 2013-06-25 20:38:30 +08:00
@ufo22940268
Beautiful是用来解析网页的。。。怎么可以说用bs4做了个爬虫系统呢 |
6
ufo22940268 2013-06-25 20:41:11 +08:00
@gullon 我理解错了
|
9
acpp 2013-06-25 21:27:28 +08:00
@ufo22940268 能说下你说的那个效率怎么样吗
|
10
seraphimhj 2013-06-25 21:34:39 +08:00
nodeJS,以前用node.io写过一个爬房价的工具
|
11
ufo22940268 2013-06-25 22:44:02 +08:00 via iPhone
@acpp 我只是觉得用起来顺手,开发快,还有我可能理解错了爬虫的意义了
|
12
duhastmich 2013-06-26 12:33:44 +08:00
|
13
duhastmich 2013-06-26 12:35:37 +08:00
@Ricepig 爬虫不异步或者多线程那效率也太低了吧。。
|
14
gullon 2013-06-26 13:56:12 +08:00
|