网址: http://www.hkexnews.hk/APP/SEHKAppMainIndex_c.htm linkList =response.xpath(u'//td[@class="pming_black12 ms-rteTableOddCol-BlueTable_CHI"]/a/@href').extract()
scrapy 中我这样写匹配是空,原因返回的编码是乱码 但是我这样写 response.body.decode(encoding="utf-8").xpath( '//td[@class="pming_black12 ms-rteTableOddCol-BlueTable_CHI"]/a/text()')
说字符串没有 xpath ,这个如何解决?求人指教?
xpath 没有问题,因为我用 request 测试过
注:不能用正则 只能用 scrapy 内置的方法,谢谢
1
chengxiao 2019-01-02 22:26:04 +08:00
|
2
luoleng 2019-01-02 22:31:20 +08:00
from parsel import Selector
Selector(text).xpath('your_xpath').extract() |