网页如下: https://www.joinquant.com/post/2997?f=sharelist&m=list
特定的内容:当前持仓和最新下单
我只想做一个发现更新就发邮件通知我的小程序,现在不知道怎样爬里面的内容。。。
3
ljcarsenal 2017-04-10 00:21:41 +08:00
看接口请求呗。 network 里。 讲道理 看生成 html 爬取的是知乎教程的水平
|
4
acheapskate 2017-04-10 00:31:26 +08:00 via Android
我也有这个问题。。 有些页面是 js 动态加载的,我用 phantomJS 的 webdriver 访问它,但是有些 class = "flag xxxx xxxx "不能用 find_element_by_class_name()获取。因为这个 class 中有空格。。🤔🤔
不知道怎么直接向网站发出 获取 js 加载内容的请求,有 v 友简单说下方法吗 |
5
zhihaofans 2017-04-10 00:36:40 +08:00 via iPhone 1
@acheapskate 有空格是因为它有多个 class ,我没用过 phantomJS 不清楚它是怎么筛选多个 class 的,如果是 jQuery 的活就将多个 class 用英文的点"."串联起来
|
6
zyEros 2017-04-10 00:38:53 +08:00 via iPhone 1
@acheapskate 动态加载最好还是分析 ajax 接口,找到规律,然后进行请求
|
7
acheapskate 2017-04-10 00:45:58 +08:00 via Android
|