V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  remnet  ›  全部回复第 16 页 / 共 16 页
回复总数  307
1 ... 7  8  9  10  11  12  13  14  15  16  
2014 年 5 月 6 日
回复了 remnet 创建的主题 Python 新人报道,带来一段自己的 Python 的正方教务系统爬虫
@Comdex 你们学校也是使用在URL里面加入一段乱七八糟的hash的方法。
其实我很不理解为什么正方会这么做?防止爬虫?可我发现也没能防止啊,无非就是多了个步骤。
这段hash似乎可以自己修改,只要保持位数不变。不然会报404错误

PS:你们学校应该可以直接套用我的代码来抓取。你可以试试看。联系我提供个账号~ 我有空加入你们学校的适配~
2014 年 5 月 6 日
回复了 remnet 创建的主题 Python 新人报道,带来一段自己的 Python 的正方教务系统爬虫
@tuteng 好像不错,也是正方系统?用啥做解析的
beautifulsoup 用过 感觉的确挺慢的
2014 年 5 月 6 日
回复了 remnet 创建的主题 Python 新人报道,带来一段自己的 Python 的正方教务系统爬虫
@RockyLee @halfcrazy 卧槽 这个可以用。验证码可以破了
2014 年 5 月 6 日
回复了 remnet 创建的主题 Python 新人报道,带来一段自己的 Python 的正方教务系统爬虫
@Comdex 现在还得手工加入验证码
2014 年 5 月 6 日
回复了 remnet 创建的主题 Python 新人报道,带来一段自己的 Python 的正方教务系统爬虫
@halfcrazy 验证码似乎是有办法可以绕过的。。。
2014 年 5 月 6 日
回复了 remnet 创建的主题 Python 新人报道,带来一段自己的 Python 的正方教务系统爬虫
@zts1993 我也在github看到你的代码了。。
这个爬虫还不是很完善,准备有空找更多学校的人来适配
1 ... 7  8  9  10  11  12  13  14  15  16  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5647 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 01:58 · PVG 09:58 · LAX 18:58 · JFK 21:58
♥ Do have faith in what you're doing.