最近使用Feed43+Yahoo pipes+feedly来监测无RSS的网页,出现了Feedly中不显示文章内容的现象。
例如用feed43为轻之国度-最近更新轻小说生成一个RSS地址;
然后把它放到Yahoo pipes里面去抓取全文,得到一个新的RSS地址;
这个RSS地址无论是订阅到The Old Reader,还是Inoreader,还是Newsblur,还是用浏览器直接打开查看xml文件,都是成功的,都可以看到全文。唯独Feedly会失败,变成这样:
这个问题还有如下特点:
- 如果是本来就有Rss源的网站,经过Yahoo Pipes抓取全文后,基本上不会出现在Feedly中无法看到内容的情况(但部分文章也会出现)。而我用的抓取全文的方法都是一模一样的,应该不是方法差异造成的。
- 经测试,订阅到The Old Reader,Inoreader,Newsblur均无问题。
- 不只是我一个人遇到问题,在Yahoo的论坛上发现了一篇贴子,上面有部分人也遇到这个问题。
附上相关Yahoo Pipes:
希望各位能够教教我如何修改Yahoo Pipes使得Feedly可以接受。因为手机上最习惯的Newsify只能和Feedly同步啊,而且Feedly的saved for later还不能导出。
1
Gandum OP 没人?
|
2
yeyeye 2015-05-17 22:52:43 +08:00
以前用pipes生成过全文rss 好像没什么问题 因为是长期用feedly的 所以基本肯定以前是没问题的 后来那些源的配置我没更新 现在也就没有了。
目测了一下 pipes输出的全文部分似乎有点不太规范,正常情况下有<>之类符号的内容是要用<![CDATA[包起来的。 要不你自己在内容里面加入这个标签包起来试试?? |
3
Gandum OP @yeyeye Yahoo Pipes的做法是把description的内容全部url编码,而且对于本来就有Rss源的网站,经过Yahoo Pipes抓取全文后输出到Feedly里面就没有问题,只是Feed43的才有问题,很奇怪
|
6
caomu 2015-05-18 05:01:10 +08:00 1
feedly的兼容性问题。。。用feedburner重烧可能能改善。。。
尝试一下把item.description来个rename/copy as成content:encoded。 |
9
yeyeye 2015-05-18 23:59:21 +08:00
@Gandum http://pipes.yahoo.com/pipes/pipe.info?_id=0266e168710054b6c147ce7ae1d556be
无RSS列表网页,生成RSS并抓取全文。 虽然被抓的网页已经不可用,但是你克隆过去很容易就理解如何做全套了。 这个好处就在于不用再依赖其他第三方了。 |
10
Gandum OP @yeyeye 多谢,我试了一下,不过貌似Yahoo抓取次数过于频繁,许多Feed43能够正常生成RSS的网站直接Ban了Yahoo,返回403
|
11
yeyeye 2015-05-19 23:59:00 +08:00
@Gandum 是我我也ban掉,你是不知道看着那服务器日志 一秒钟都不间隔直接读取几十个我的页面 (获取每个item网址的全文的时候) 不全文的话频率还好的 会缓存一定时间
|