之前用GAE 的本地环境访问Raspberry Pi 很慢很慢,以为是Raspberry Pi 的性能问题,后来发现不是。
原来可以跑得这么欢,当然我要求不高。
不久后我会提供外网访问的DEMO。
WEB版的通用型采集工具 NewCrawler.COM
上两张图,


原来可以跑得这么欢,当然我要求不高。
不久后我会提供外网访问的DEMO。
WEB版的通用型采集工具 NewCrawler.COM
上两张图,




1
workaholic Mar 30, 2013
用java写的? 基于什么库?
|
2
ipoh Mar 30, 2013
楼主怎么买的 我也想买一个
|
3
sohoer OP @workaholic 用的HttpURLConnection+正则,没有用其它第三方库,xpath,javascript支持倒是用了,不过现在把他当成插件了。
@ipoh 淘宝买的,如果需要你留个邮箱我把交易记录发给你,我现在每天晚上都是开着的,在爬煎蛋妹子图,稳定性挺好的。 |
4
workaholic Mar 31, 2013
我最近也在爬图片,请教个问题:图片上水印你怎么处理的?肯定不希望自己的图片上带上别的网站的水印吧?
|
5
chemhack Mar 31, 2013 via iPad @workaholic 自己的图片。。。。。 我真是吐槽无力了
|
6
workaholic Mar 31, 2013
@chemhack 神经病
|
8
34D Mar 31, 2013 via Android
自己的图片吐槽无力+1。
|
9
workaholic Mar 31, 2013
@34D QNMLGB
|
10
G0dBlessMe Mar 31, 2013
自己的图片吐槽无力+1
|
11
ywencn Mar 31, 2013
没懂你们在说什么自己的图片?
|
13
jason52 May 19, 2013
-----------------
from pyquery import PyQuery as pq import time fp=open("meizhitu.txt",'w') for i in range(800,813): url = 'http://jandan.net/ooxx/page-' + str(i) d1 = pq(url) posts = [] for anchor in d1('#comments p>img'): anchor = d1(anchor) ans = anchor.attr('src') posts.append(ans) print >>fp,ans print ans fp.close ---------------------- 用pyquery写了一个简单的爬妹子图的脚本 |
14
jason52 May 19, 2013
哎呀,v2ex发代码都乱掉了。。python缩进都没了。。看来以后不能直接放代码了。。
|