1
s51431980 2015-02-03 09:31:15 +08:00 2
可以抓啊,在capture之前等待几秒,等待几个页面跳转,这应该是新浪反爬虫的策略。
我之前写的登陆代码。 ``` var casper = require("casper").create(); casper.start('http://weibo.com/login') casper.wait(2000, function() {}); casper.waitForSelector(".W_login_form", function(){ this.fillSelectors('.W_login_form', { 'input[name="username"]': 'XXXXXX', 'input[name="password"]': 'XXXXXX', }, false); this.click(".W_login_form .login_btn a"); }); casper.wait(5000, function(){ this.echo(this.getCurrentUrl()); this.capture("5000.jpg"); }); casper.run(); ``` |
2
binux 2015-02-03 10:36:34 +08:00 1
不问是不是,就问为什么,V2越来越像知乎了啊
|
3
icedx 2015-02-03 10:50:04 +08:00
你什么时候产生了PhantomJS 不能抓取新浪微博的幻觉的
|
4
m939594960 2015-02-03 10:56:57 +08:00
为何我一用 PhantomJS 抓取 运行一段时间就要报错呢。。。。。。
|
5
sivacohan 2015-02-03 13:55:50 +08:00 via Android
@m939594960 你看一下issue就知道了
|
6
m939594960 2015-02-03 14:36:08 +08:00
@sivacohan thanks!
|