我们在做量化(目前是数字货币),每天有几个 G 的数据,以后还会更多(现在只抓了一个交易所有限的交易对),所以想线上数据库保留最近几天的数据,然后本地建一个备份(完整的),我们现在没有运维
交易所都在境外,所以我们用 HK 的服务器抓数据,因为翻墙不靠谱。用的 aws 的数据库,如果不做归档,数据会非常大,直到我们负担不起,毕竟现在还没赚钱呢
我们用的是 postgresql
不论何种方案,最终的结果就是归档并删除已归档的数据,所以排除了 pg_dump、pg_dumpall
最后想到这里大神多,看看有没有更好更成熟的方案,射射大家。
1
Gilgamesh7 2019-10-16 14:46:30 +08:00
把实时获取到的数据解析后放入消息队列,国内服务器或者本地解析后存储。
|
2
bebopx 2019-10-16 22:47:18 +08:00
之前做爬虫抓电商数据,存过 AWS 数据库。归档是直接压缩导到 S3 上。S3 比本地存储还便宜。不过对数据完整性要求不高。
|
4
hujianxin 2019-10-17 19:42:09 +08:00
1. 可不可以直接把抓取的数据写入消息队列,然后两头消费。你的主数据库配置一个 TTL 类似的东西就可以了。这个方案存在两个问题,第一是实时性 能不能达到你的要求,第二国内读国外的消息队列,速度能不能满意。
2. 如果第一个方案行不通的话,你自己提出来的方案二其实也是不错的。第一开发工作量不大。第二稳定性可靠性都可以通过思考容错来保证。 |