想获取知乎发现页的问题的答案内容,代码如下:
import requests
from pyquery import PyQuery as pq
url = '
https://www.zhihu.com/explore'headers = {
'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
}
html = requests.get(url, headers=headers)
doc = pq(html.text)
results = doc('.explore-tab .feed-item').items()
for item in results:
answer = pq(item.find('.content').html()).text() #这里为什么直接写 item.find('.content').text()出来的
内容是夹带符号,而且内容是不完整的。这段代码要怎么理解?
第一次提问,写的有点乱。