xpath 问题相关求回答！谢谢大佬们。

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› virtualenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› Pyflakes

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

This topic created in 2559 days ago, the information mentioned may be changed or developed.

零基础学Python（全彩版） 怎么吧这个标签里的汉字用 xpath 全部提取出来。谢谢大佬们。

font

xpath

全彩版

零基础学

15 replies • 2019-06-21 17:27:31 +08:00

Govn

Jun 20, 2019

零基础学Python（全彩版）
没写全。。

JCZ2MkKb5S8ZX9pq

Jun 20, 2019 via iPhone

em//text()
这样行嘛？

limuyan44

Jun 21, 2019

chrome 控制台右键 copy wiht xpath 这个没给文档结构写了哪里准哦

ksedz

Jun 21, 2019

normalize-space(.//em)

lxychn

Jun 21, 2019

function getElementByXpath(path) {
return document.evaluate(path, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;
}

var text = getElementByXpath("//font[@class='skcolor_ljg']/text()")

Govn

Jun 21, 2019

@JCZ2MkKb5S8ZX9pq 不行的呀，这样提取不出来 python。

darknoll

Jun 21, 2019

用个正则表达式得了

wudamen

Jun 21, 2019

from lxml import etree

html = '零基础学Python（全彩版）'

print(etree.HTML(html).xpath('string(//em)'))
零基础学 Python （全彩版）

R0n1n

Jun 21, 2019 via Android

用正则，这样就得到两个问题啦🤣

Govn

Jun 21, 2019

@R0n1n 是的我决定用正则了。

Govn

Jun 21, 2019

@darknoll 是的，我决定用正则了。

Govn

Jun 21, 2019

其实昨天试了一下用 xpath （"string(//font[@class='skcolor_ljg'])")可以提取出来。

foxyier

Jun 21, 2019

//em/text()[2]

foxyier

Jun 21, 2019

修正楼上。把[2]去掉。

dsg001

Jun 21, 2019

>>> from lxml import etree
>>> html = '零基础学Python（全彩版）'
>>> doc = etree.fromstring(html)
>>> doc.xpath('//em//text()')
['零基础学', 'Python', '（全彩版）']