伪电工写了一个简单的程序将新闻类网站转成RSS,有一点问题:
1.目前是定时抓取,每次都会解析一遍首页和各文章网页,很多都是重复劳动。如何简单有效地判断某文章是否已经抓取过,从而避免重复抓取?
2.生成的RSS需要包含所有的文章吗,还是只要包括最新的几条就行?如果是后者,那么RSS阅读器是否可能漏掉一些老文章。
3.有什么更好的方法能实现即时推送到手机?除了RSS以外。
谢谢!
1
whatisnew 2015-05-04 23:28:11 +08:00
1. 做一个 ping server
2. 你不可能把所有文章都抓取了 3. 即时推送是另外一个话题。 |
2
erik0 OP |