请教一个分布式问题，具体请看正文描述，非常感谢！

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 2132 days ago, the information mentioned may be changed or developed.

有一批数据在数据库中，分 128 表按小时增量存储，现在有多个机器每一小时处理一次，这些机器是消费者角色，每个小时生产数据后，及时消费处理这些数据，待这个小时的数据全部处理完成后汇总这一个小时的数据，这里面涉及多个分布式协调问题，请教一个比较好的解决方案？

注意点

谢谢大家啦！麻烦大家推荐案例或者书籍或者大致思路，不甚感激!!

4 replies • 2020-08-08 00:28:46 +08:00

billlee

Aug 8, 2020

这不是典型的 map reduce 问题吗？直接用 spark 得了

vchat

Aug 8, 2020

@billlee 整体上是这样但是这个一是没有这么大的数据体量用 spark 太牛刀了二是需要在一个 java 语言的系统中处理

lhx2008

Aug 8, 2020

这种就是流式计算之类的，不要自己写轮子了，也没有必要用 sql 分表什么的。。

billlee

Aug 8, 2020

@vchat #2 128 分片我觉得已经不算很小了吧，你也提到了很多需要注意的问题，这些都自己解决不就是重新发明 spark 吗？ Spark 也是 jvm 生态的啊，可以用 java 开发应用

请教一个分布式问题， 具体请看正文描述，非常感谢！