先是写了一个新闻爬虫, 爬取新闻标题, 再用自己简单写的几个条件筛掉可能存在的标题党, 留下一句话新闻.
顺便加上了"历史上的今天", 和"名人名言"功能, 最后又接入了心知天气 API, 根据读者 ip 查询所在城市的天气.
看起来跟微信群里那些新闻早报是不是很像了? ^_^
提供 html 页面和 api 服务
HTML: http://news.topurl 点 cn
API: http://news.topurl 点 cn/api
(因为我的域名在 V2 发出来会被系统 ban24 小时, 所以只好把"."换成"点")
1
PP 2019-09-22 15:21:35 +08:00 via iPad 1
这
又 终于 原来 专家 |
2
Aether 2019-09-22 18:22:04 +08:00
为啥会被 BAN ?
|
3
yamedie OP @Aether 因为 v2 不让发短链接(防止 aff ),我的域名又符合新浪( url 点 cn )的特征...所以被 ban 了,不过我的站确实是做网址缩短的,被 ban 也应该
|
4
MyFaith 2019-09-22 18:52:23 +08:00
又一个摸鱼神器
|
5
wushigejiajia01 2019-09-23 08:57:30 +08:00
额 我按住 F5 狂刷新, 就 404 了
然后等个 10 来秒, 再刷有一下, 就恢复了..... |
6
yamedie OP @wushigejiajia01 嗯嗯,为了防止被大佬打,加了调用频率限制,单个 ip15 秒内只能访问 8 次
|
7
wushigejiajia01 2019-09-23 09:03:03 +08:00
@yamedie 额, 那不要给 404 嘛....体验不好
|
8
yamedie OP @wushigejiajia01 现在访问频次超限继续刷新会返回若干次错误提示 json 报文, 继续刷新就会 404 了, 因为我认为这时候没必要对请求做出响应了(不响应就会 404), 直到 15 秒过去, 才会继续响应
|
9
MrSheng 2019-09-23 09:58:30 +08:00
我这边只能看标题不能点,请问正常么?
|
10
yamedie OP @MrSheng 因为最初想法是供复制粘贴到微信群, 作为新闻早读摘要的, 所以没有加链接, 我也在考虑要不要加上链接.. 那我先加上吧
|
13
pianjiao 2019-09-23 10:38:32 +08:00 via Android
用上了😂能在丰富一点嘛
|
15
npe 2019-09-24 17:23:06 +08:00
数据从哪些地方采集的哦?
|
16
yamedie OP @npe 新闻是定时任务从界面新闻爬取的,界面新闻质量比较高,标题党震惊体几乎没有,而且很多标题本身是一句话新闻。历史上的今天和名人名言,是从 csdn 下载的 excel 格式数据库。
|
18
tomxin7 2019-09-25 17:32:59 +08:00
天气预报在哪里~~
|