1
zander 2017-05-02 08:02:49 +08:00 via Android
国内这些个大公司喜欢把 api 抓死,ifttt 能干的真的不多。
|
2
wuhx OP 是的 所以 CloudMonad 用了浏览器模拟的方式实现
|
3
nicoljiang 2017-05-02 16:15:32 +08:00
但是你没有任何防反抓取的机制,所以就没什么意思了。比如你说搜狗公共账号那个,连真实地址这么简单的东西都弄不出来,更别说验证码了。有何实用价值?
|
4
ansheng 2017-05-02 16:50:59 +08:00
多说不是不维护了吗?露珠怎么还在使用多说呢?
|
5
wuhx OP @nicoljiang
1. 支持自己设置爬虫代理地址 2. 内置的[验证码识别服务]( http://xun.im/2017/04/23/imhuman/) 能 bypass 掉 12306 的看图说话验证 搜狗公众号那个,没听懂你在说什么 |
6
nicoljiang 2017-05-04 16:09:13 +08:00
@wuhx 我的意思是
http://xun.im/2017/04/23/example-sougou-to-kindle/ 这里面提到的例子 「也就是说,只要两条记录的标题字段相同就判断它们是同一条记录。 这么做的原因是:weixin.sogou.com 上的公众号文章链接都是临时链接,每次返回的结果都不一样,需要排除其干扰。」 为什么弄不出真实地址,要用 title 判断重复? |
7
wuhx OP @nicoljiang
搜狗微信公众号的搜索结果是临时链接,这是微信为了控制内容做的限制,从这里弄出真实地址是不可能的(不要怀疑鹅厂员工的技术) CloudMonad 能做的是对真人操作浏览器的模拟,搜狗公众号那个例子对后台来讲只是一组浏览指令,它不了解操作的内容,也不会针对搜狗微信网站做任何特殊处理。 你如果想获取微信公众号文章的永久链接方法有很多,最简单的是弄个 Web 微信,定时刷一下公众号页面。 |