先放github 地址。
抓取方式:
-
-
模拟登陆微信公众号平台,借此获取需要爬取公众号文章的 url
-
通过
mitmproxy手机抓包,得到appmsgtoken和cookie,爬取文章的阅读数、点赞数及评论信息
-
-
不使用模拟登陆,用抓包工具获取相关参数后,直接抓取
有以下问题:
-
不知道如何使用
python在shell中显示获取到的二维码,目前使用的方式是用matplotlib和PIL显示。 -
获取微信公众号文章的时候,一次性不能爬取太多,一次最多貌似只能有 30、40 条。
-
API 设计上可能存在问题
以上,望大佬轻喷,提出意见