1
ty89 2016-12-29 16:08:08 +08:00 1
lxml 支持 xpath ,解析的效率也比 BS 高不少。
|
2
geew 2016-12-29 16:10:47 +08:00 1
pyquery
|
3
enenaaa 2016-12-29 16:14:39 +08:00 1
select('body > div > div > ul > li > span[class="cls1"]') 这样?
|
5
Lonely 2016-12-29 16:56:37 +08:00 1
生成 BS 对象时选择 lxml ,不要用默认的
|
6
cyrbuzz 2016-12-29 17:44:47 +08:00 1
bs 支持 css 语法吧,在 firefox 里复制唯一选择器(大部分情况下比 chrome 获取的短一些)。
把这个直接用 select 方法就可以获取到了。 用 html.parser 解析就可以。 |
7
jiezhi OP |
8
zhangsen1992 2016-12-30 11:35:17 +08:00
xpath lxml 最快
|