1
bao3 2016-09-16 14:01:39 +08:00 via Android
哈哈,我正在找这种,我正好要租房,所以想要这种可以抓下来统计,再下手的脚本。我是小白,所以感谢了。叩拜
|
2
wyntergreg 2016-09-16 17:53:06 +08:00
scrapy 略慢啊
|
3
tumbzzc 2016-09-16 21:25:58 +08:00
看来, V2EX 已经没人对这种感兴趣了,除非你说你爬了某榴
|
4
zhongshaohua 2016-09-16 21:43:54 +08:00
@tumbzzc 爬了草某也可以的
|
5
LokiSharp 2016-09-16 22:03:26 +08:00
为什么 items 要分成 3 个,而里面的 class 名都取 ItjuziItem 啊= =感觉这样好乱啊。。。
|
6
plantparknet OP |
7
plantparknet OP @LokiSharp 才学,并不是特别会用。。。
|
8
coolloves 2016-09-17 08:14:04 +08:00 via Android
马克!感谢分享!
|
11
plantparknet OP @icylord 哈哈哈哈 看来是不会翻墙呀~~ 放到收藏夹好久了~~ 可惜的是某榴的种子文件下载是非常麻烦呀~~
|
12
noahyu 2016-09-18 09:51:50 +08:00
去年年初爬过,当时的数据水分很大,同一房源重复发布频率很高(不是对房源更新,而是另外发一条) 需要做一些去重处理后再分析
|
13
plantparknet OP @noahyu 哦,数据爬取下来还没分析呢~~ 还没注意到这个问题
|