前提是不用官方 API (因为申请的话也大概率不会通过,还有就是官方 API 提供的数据不满足需求)
- Twitter 反爬没有 Facebook 那么严格,公开界面不用登陆就可以获取数据,但目前遇到的问题是,初学爬虫,只会找 API 或者解析 HTML,Twitter 这种全是 JS 的搞得我一头雾水
- Facebook 则是完全没有思路,要封 IP 还要封账号,进去必须登陆,就算进去了,全是 JS 也无从下手
目前方案有:
- 用现成的库,比如 twint 、facebook-scraper 这种,但不满足数据需求
- Rsshub,需要自建且不满足数据需求
- Rss generator 服务,成本会变高又不满住数据需求
注:不满住数据需求大多是指获取不到评论