V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
dtgxx
V2EX  ›  问与答

大佬们,麻烦帮忙估算下大数据的存算能力

  •  
  •   dtgxx · Feb 24, 2023 · 521 views
    This topic created in 1168 days ago, the information mentioned may be changed or developed.
    没做过性能评估这块,目前来了个需求,不知道咋评估了。

    大约 10PB 的数据,单条 5kb ,通过 kafka 集群通过 flink 实时接入到 hdfs ,然后上面通过 spark 做数据处理。
    想问下大约要多少台机器,每台机器啥配置。kafka 几个节点,怎么部署呢,麻烦 v 吧大佬们了,帮忙给个参考!非常感谢!


    另外这个 10PB 的意思是,hdfs 保存最新的 10PB 就可以了,要定期的清理,数据是实时流入的。
    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1124 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 17:58 · PVG 01:58 · LAX 10:58 · JFK 13:58
    ♥ Do have faith in what you're doing.