RT,
比如在微博中搜索"话题A",里面每条微博都是这个样式
#话题A,这是链接http://t.cn/link
那么请问如何做到可以在这个话题的搜索页里,一次点击完成本所有页内的所有微博的链接点击?
或者,也可以换个思路,如何做到在本页中一次点击所有 t.cn 为域名的链接?
1
arachide 2015-02-15 20:53:48 +08:00
这需要解析html
|
2
NeoAtlantis 2015-02-15 20:59:12 +08:00
jquery试试?
|
4
copriwolf OP @NeoAtlantis 没有用过,请问能详细讲解一下吗
|
6
aaaa007cn 2015-02-15 21:51:54 +08:00 1
https://developer.mozilla.org/docs/Web/API/Document.querySelectorAll
[].forEach.call(document.querySelectorAll('a[href^="http://t.cn/"]'), a => 点击(a)) |
7
copriwolf OP @aaaa007cn 本人知识浅薄,看完了里面的api页面,请问这个是怎么使用呢,他这是放在页面中吗?可是在微博中页面无法修改,难道使用审查元素?
|
8
aaaa007cn 2015-02-15 22:32:28 +08:00
你没说是在什么环境下,要如何操作
所以我假定你是要在浏览器中执行 要在浏览器中执行自己的 javascript 脚本 无非通过自制浏览器扩展、用户脚本、代理注入 如果偶尔要用 那么直接使用开发者工具(就是审查元素会打开的那个)中的控制台也行 上面只是演示了如何通过 css selector 选取元素并遍历 具体怎么点击还要看你想怎么做 比如 http://wiki.greasespot.net/GM_openInTab |
9
irgil 2015-02-15 22:44:57 +08:00 1
用正则提取出来,去重,再用curl访问
|
10
copriwolf OP @aaaa007cn 我是rmbp os x yosemite,chrome。我是想直接在浏览器中执行javascript,一执行,则自动在新标签页打开本页中所有包含t.cn域名的网址。 http://wiki.greasespot.net/GM_openInTab,这个油猴的脚本功能是打开新标签页并切换过去吧?
请问你刚刚演示的程序是如何在console中执行,我执行后无效。 |
11
lk09364 2015-02-15 23:13:57 +08:00 1
@copriwolf 油猴api 不能在console 里用吧…,另外#6 给出的代码是伪代码。实际使用时:
[].forEach.call(document.querySelectorAll('a[href^="http://t.cn/"]'), function(v){ console.log(v) }) |
13
oott123 2015-02-16 00:14:54 +08:00
抢红包?
|
14
DearTanker 2015-02-16 00:17:21 +08:00
@oott123 哈哈。希望作者做出来可以分享一下。。。
|
16
typcn 2015-02-16 07:41:20 +08:00 1
用 pyspider 写了个自动的
def on_start(self): self.crawl('http://www.weibo.com/p/1008081c4e75201132722bf842ceec29e11549/home', headers ={'User-Agent': 'TYPCNSpider'} , callback=self.index_page) def index_page(self, response): for each in response.doc('a[title^="http://t.17wo.cn"]').items(): self.crawl(each.attr.title, headers = {'User-Agent': '你的UA '}, cookies = {你的COOKIE}) |
17
pljhonglu 2015-02-16 09:24:01 +08:00
抢红包专用~哈哈
|